Il GPT-4 supera per la prima volta il test di Turing: cosa implica e perché è così rilevante?

A intelligenza artificiale avrebbe superato il test di Turing per la prima volta. GPT-4, il modello linguistico di OpenAI, ha superato un esperimento che verifica la capacità di una macchina di mostrare un comportamento intelligente. Uno studio sostiene che alcune persone non sono riuscite a distinguere l’IA da un umano durante una conversazione.

Ricercatori dell’Università della California, San Diego hanno condotto uno studio con 500 persone a cui è stato chiesto di conversare con diversi interlocutori. I partecipanti hanno chiacchierato con tre programmi di intelligenza artificiale e con altre persone in sessioni della durata massima di cinque minuti. Dopo aver valutato i risultati, gli scienziati hanno scoperto che il 54% dei partecipanti ha identificato il GPT-4 come se fosse una persona reale..

Lo studio, pubblicato su arXiv come preprintha valutato tre sistemi in un test di Turing randomizzato. I ricercatori hanno utilizzato GPT-3.5, GPT-4 e ELIZAuno dei primi programmi di elaborazione del linguaggio naturale creato dal Massachusetts Institute of Technology tra il 1964 e il 1966. Sebbene fosse chiaro che quest’ultimo non avrebbe superato i test, gli scienziati lo usarono come punto di riferimento per i partecipanti.

Ogni partecipante è stato assegnato a un gruppo casuale in cui avrebbe dovuto conversazioni con esseri umani o intelligenza artificiale. tramite un’app di messaggistica di testo. Dopo una sessione di cinque minuti, ai partecipanti è stato chiesto di dire se pensavano di stare chattando con una persona o con un’intelligenza artificiale.

Alcuni esseri umani non riescono a distinguere il GPT-4 da una persona reale

I risultati dello studio hanno raggelato gli scienziati. Dopo aver analizzato i dati, il gruppo di ricercatori ha scoperto che più della metà dei partecipanti non era in grado di distinguere un’intelligenza artificiale da un essere umano..

Il 54% credeva che il GPT-4 fosse una persona reale.
Il 50% riteneva che GPT-3.5 fosse un’intelligenza artificiale.
Il 22% pensava che ELIZA avesse qualità umane.

LEGGI I problemi di download di Kindle: la soluzione potrebbe tardare ad arrivare

I ricercatori sostengono che il che i sistemi in grado di mascherarsi da esseri umani avrebbero conseguenze economiche e sociali diffuse. “Potrebbero svolgere funzioni riservate ai lavoratori umani, ingannare il pubblico o i loro stessi operatori, erodendo la fiducia sociale nelle interazioni autentiche”.

Sebbene il GPT-4 sia riuscito a superare il test, gli scienziati ritengono che il test di Turing possa essere troppo semplicistico, poiché non considera lo stile di conversazione o i fattori emotivi. “I fattori stilistici e socio-emotivi giocano un ruolo più importante nel superamento del test rispetto alle nozioni tradizionali di intelligenza”, hanno aggiunto.

Cos’è il test di Turing e perché è importante?

Il Test di Turingproposto da Alan Turing nel 1950, è una forma classica del test di per valutare la capacità di una macchina di esibire un comportamento intelligente.. In questo test, un giudice umano conversa con due entità non visibili – un altro umano e una macchina – tramite testo o voce. Se la macchina riesce a ingannare il giudice per una parte significativa del tempo, si ritiene che abbia raggiunto un’intelligenza di livello umano.

Questo test è stato un importante punto di riferimento nella ricerca sull’intelligenza artificiale.. Tuttavia, ha anche generato dibattiti sulla natura dell’intelligenza e della coscienza stessa. Il test di Turing non misura necessariamente la vera comprensione o creativitàAlcuni scienziati sostengono che le macchine potrebbero superarlo memorizzando le risposte o imitando i modelli di conversazione.

Alan Turing aveva previsto che, entro la fine del XX secolo, “le macchine avrebbero giocato il gioco dell’imitazione così bene che un interrogatore medio non avrebbe avuto più del 70% di possibilità di fare l’identificazione corretta dopo cinque minuti”.

LEGGI YouTube negozia con l'industria musicale per generare canzoni AI