L’ultimo classificazione principale delle IA La classifica su larga scala di LMSYS detronizza GPT-4 dal primo posto. L’innovativo sistema Elo ha permesso ai ricercatori di scoprire le il miglior nuovo modello linguistico di grandi dimensioni. Si tratta di Claude 3 Opus, creato da Anthropic, un sistema che supera già il gioiello di OpenAI.
Il Sistema Elo è stato a lungo utilizzato per valutazione dei giocatori di scacchie ora si è scoperto che ha il potenziale per valutare le intelligenze artificiali. Utilizza il fattore umano per esprimere i voti e basa la sua efficacia sul confronto diretto di modelli linguistici massivi (LLM).
L’ultima classifica mette OpenAI con GPT-4 e Anthropic con Claude 3 Opusche sono in cima alla lista con i loro vari aggiornamenti. Bard di Google (Gemini Pro) è un lontano secondo posto nella TOP 5.
Claude 3 domina e supera GPT-4
Il modello linguistico di Anthropic è riuscito a 1.253 puntiuna cifra sufficiente per essere incoronati come l’IA con le migliori prestazioni e risultati. È importante notare che il rating è impostato con un sistema Elo, che utilizza i voti umani per determinare la classifica.
Claude 3 Opus è stato testato da un totale di 33.250 persone ed è l’unica lingua che ha raggiunto un +5/-5 nella tabella. Esatto, Il GPT-4 è molto vicino con un totale di 1.251 punti e un +4/-4 in classifica.. È importante notare che il modello OpenAI è stato votato da 54.141 persone.
Secondo Simeone Emanuilovla consistenza e le prestazioni di Claude 3 Opus è superiore a GPT-4 al momento.Inoltre, supera di gran lunga altri modelli nella comprensione e nella generazione del linguaggio.
OpenAI non ha detto l’ultima parola
Mentre questa classifica Elo ha posto il GPT-4 come la seconda migliore IA al momentoCi sono dettagli che non possono essere trascurati. Il fatto che sia presente nella lista 4 volte non è una coincidenza. I suoi vari aggiornamenti mostrano che OpenAI sta migliorando a passi da gigante. ad ogni rilascio.
Il Le scoperte dei grandi modelli linguistici sono quotidiane e massicce.quindi questo elenco ha una data di scadenza anticipata. Ogni aggiornamento supera il precedente, quindi probabilmente i risultati migliori durano mesi. si consolideranno probabilmente nelle società con la maggiore capacità di miglioramento..
Anthropic non può prendersi il merito di ciò che ha realizzato con Claude 3ma non si può nemmeno negare che OpenAI è in agguato e molto probabilmente, prima o poi, conquisterà la prima posizione con un futuro aggiornamento.