Le voci erano giuste. OpenAI ha appena annunciato o1 y o1-minii suoi primi modelli di intelligenza artificiale con capacità di ragionamento. Sfruttano la tecnologia internamente nota come Strawberry e sono progettati per risolvere compiti complessi in campi come la scienza, la matematica e la programmazione. Ad oggi, sono disponibili nelle versioni a pagamento di ChatGPTe una versione mini sarà aggiunta alla versione gratuita nel prossimo futuro.
“Nei nostri test, l’aggiornamento del modello in arrivo ha ottenuto prestazioni simili a quelle degli studenti di dottorato in compiti di benchmark impegnativi in fisica, chimica e biologia. Abbiamo anche scoperto che eccelle in matematica e programmazione. In un esame di qualificazione per le Olimpiadi Internazionali di Matematica (IMO), GPT-4o ha risolto correttamente solo il 13% dei problemi, mentre il modello di ragionamento ha ottenuto l’83%”, spiega OpenAI a proposito di o1.
OpenAI ha lanciato o1 come un modo di anteprimain modo che non ha ancora integrato il 100% delle sue funzionalità in ChatGPT.. Ciò significa che non è ancora in grado di gestire le immagini, né di cercare informazioni sul web. Tuttavia, i collaboratori di Sam Altman ritengono che questa nuova intelligenza artificiale rappresenti un salto di qualità nelle capacità, e per questo hanno deciso di chiamarla o1.
La startup ha pubblicato alcuni video con esempi che mostrano la nuova AI mentre risolve problemi o istruzioni complesse, o addirittura risponde a semplici domande a cui altri modelli linguistici non sono riusciti a rispondere. Di seguito, è possibile vedere OpenAI o1 mentre crea un videogioco da zero sulla base di un prompt e anche quando è stato chiesto quante R ci sono nella parola “testo”. Fragolaa cui il GPT-4o non ha saputo rispondere correttamente.
Quando si utilizza o1 in ChatGPT, si nota un ritardo nei tempi di risposta rispetto a GPT-4o e ad altri modelli OpenAI. Ciò è dovuto al fatto che l’intelligenza artificiale utilizza le sue capacità di ragionamento per risolvere la richiesta o l’interrogazione, anziché attivare una risposta rapida. L’obiettivo della nuova tecnologia non è solo quello di fornire risposte più accurate, ma anche di porre fine alle allucinazioni. Questo non significa che l’intelligenza artificiale non commetta errori o non si inventi una risposta. Ma i suoi sviluppatori affermano che ciò è meno frequente rispetto alle versioni precedenti di GPT.
“I ricercatori del settore sanitario possono usare o1 per annotare i dati di sequenziamento delle cellule, i fisici per generare complicate formule matematiche necessarie per l’ottica quantistica e gli sviluppatori di tutti i settori per creare ed eseguire flussi di lavoro in più fasi”.
OpenAI
ChatGPT aggiunge capacità di ragionamento con o1 e o1-mini, da OpenAI
Da OpenAI ha commentato che l’addestramento di o1 è stato eseguito con un set di dati personalizzato e un nuovo algoritmo di ottimizzazione. A differenza di GPT-4o e dei modelli precedenti, questa IA non imita i suoi modelli di addestramento, ma utilizza l’apprendimento per rinforzo per risolvere da sola i problemi che devono affrontare.
L’uso di Strawberry, precedentemente noto come Q* o Q-Starhanno generato cortocircuiti interni all’azienda di Sam Altman. Non sorprende quindi che l’azienda abbia posto particolare attenzione alla sicurezza. OpenAI indica che lo sviluppo di o1 è stato accompagnato dall’implementazione di misure di sicurezza più robuste, da test rigorosi e dalla collaborazione con le autorità e i regolatori di diversi Paesi.
OpenAI sostiene inoltre che o1 è molto meno suscettibile di jailbreakIl primo è quello di impedire il jailbreak, cioè i tentativi degli utenti di aggirare le sue protezioni. “In uno dei nostri test di jailbreak Il più difficile, GPT-4o, ha ottenuto un punteggio di 22 (su una scala da 0 a 100), mentre il nostro modello o1-preview ha ottenuto un punteggio di 84″, affermano gli sviluppatori dell’intelligenza artificiale.
Per quanto riguarda o1-mini, si tratta di una versione più piccola e fino all’80% più economica di o1, che si distingue anche per la sua velocità. Secondo OpenAI, o1-mini eccelle soprattutto nei compiti di programmazione.. Un dato interessante che è stato condiviso è il tempo impiegato dai nuovi modelli per fornire una semplice risposta testuale tramite ChatGPT. GPT-4o ha risposto in soli 3 secondi, o1-mini in 9 secondi e o1 in 32 secondi. Questo tempo extra è il tempo che la nuova IA impiega per pensare e ragionare sulle sue risposte.
Integrazione e prezzi di ChatGPT
A partire da oggi, gli abbonati a ChatGPT Plus e Team possono accedere a OpenAI o1 e o1-mini dal menu di selezione del modello di chatbot. La prossima settimana, questa funzione sarà resa disponibile per gli utenti di Enterprise e Edu. Come indicato in precedenza, la versione gratuita di ChatGPT riceverà o1-mini, anche se non si sa ancora quando.
Si noti che l’avvio limiterà il numero di interrogazioni ai modelli o1 tramite ChatGPT, almeno inizialmente. Per gli utenti Plus e Team, ci sarà un limite settimanale di 30 messaggi per OpenAI o1-preview e 50 messaggi per o1-mini.
Per gli sviluppatori, OpenAI consentirà l’uso dei modelli o1 tramite il livello API 5, ma bisogna prepararsi a pagare. L’accesso alla nuova IA è significativamente più costoso rispetto agli altri modelli dell’azienda. In particolare, il modello o1-preview costa 15 dollari per 1 milione di token di input e 60 dollari per 1 milione di token di output.. Si tratta rispettivamente del triplo e del quadruplo dei costi del GPT-4o per quantità identiche di gettoni.
OpenAI prevede di continuare a rilasciare modelli della serie o1 e GPT, quindi la nuova tecnologia tecnologia non sostituisce la precedente. Inoltre, hanno promesso di aggiornare l’IA per aggiungere in futuro il supporto all’elaborazione di documenti e immagini e alla navigazione web.