Google lancia Gemini 1.5 e distrugge OpenAI e GPT-4

Google ha appena introdotto Gemini 1.5il primo importante aggiornamento del suo modello di intelligenza artificiale di nuova generazione. E promette di mettere in crisi sia OpenAI che GPT-4. Questa nuova versione sarà inizialmente disponibile per gli sviluppatori e i clienti aziendali, mentre il pubblico in generale arriverà presto.

L’evoluzione di Gemini verso la versione 1.5 è stata portata da Gemini 1.5 Pro. Si tratta della variante AI general-purpose che, ad esempio, alimenta Gemini, il chatbot precedentemente noto come Bard, che è arrivato anche a sostituire Google Assistant. Per il momento, Mountain View non si è espressa su quando Gemini Nano e Gemini Ultra saranno aggiornati alla versione 1.5.

Uno dei primi punti di forza di Gemini 1.5 è che promette un formidabile salto di prestazioni in ambito Pro rispetto all’originale. Gli sviluppatori di questa tecnologia affermano che raggiunge risultati simili a Gemini 1.0 Ultrapur consumando meno risorse computazionali.

Un altro elemento che Google ha evidenziato è che Gemini 1.5 Pro è dotato di una finestra contestuale di 1 milione di gettoniChe cosa significa? Che l’intelligenza artificiale può raccogliere molte più informazioni contemporaneamente e comprendere richieste molto più complesse. Secondo i californiani, questa è la finestra di contesto più ampia di qualsiasi modello fondamentale rilasciato finora, indipendentemente dalla scala.

La più grande finestra di contesto mai vista in un modello fondazionale

Vale la pena notare che il milione di token non sarà immediatamente disponibile per tutti gli utenti. Google vi farà pagare per accedere a questa funzione. Inizialmente, Gemini 1.5 Pro offrirà una finestra di contesto di 128.000 gettoni, la stessa attualmente fornita da GPT-4 Turbo. L’azienda introdurrà poi una scala di prezzi per opzioni più ampie, fino a 1 milione di gettoni.

LEGGI LG presenta l'M3 OLED, un televisore completamente privo di porte

Per comprendere meglio l’importanza di questo problema, è importante ricordare che la versione 1.0 di Gemini Pro aveva una finestra di contesto di soli 32.000 gettoni. Claude 2.1 di Anthropic aveva 200.000 token. Ma Google non si è fermata a 1 milione di token. L’azienda afferma che durante la ricerca e lo sviluppo di Gemini 1.5 Pro hanno sperimentato fino a 10 milioni di.

Cosa si può ottenere con 1M di token? Secondo Google, Gemini 1.5 Pro può elaborare al volo “1 ora di video, 11 ore di audio e basi di codice con 300.000 linee di codice o più di 700.000 parole”. Nel video qui sotto, ad esempio, l’IA mostra come può risolvere problemi in un blocco con più di 100.000 linee di codice:

La nuova versione dell’intelligenza artificiale sviluppata a Mountain View è stata notata anche per la sua maggiore capacità di ragionamento. Secondo i suoi creatori, è in grado di comprendere grandi volumi di informazioni, come documenti di centinaia di pagine, per analizzarli, riassumerli o contrassegnare porzioni specifiche, a partire da una singola richiesta o da un’altra. pronta. Lo stesso vale quando si tratta di video, dove è possibile identificare gli elementi di un clip sia dalle descrizioni testuali che dalle immagini.

Alcuni fortunati stanno già testando Gemini 1.5 Pro con una finestra di contesto di 1 milione di token in via preliminare. Questo viene fatto con clienti e sviluppatori selezionati via Vertex AI y Studio AI. Anche se Google ha spiegato che si tratta di una funzione sperimentale e che i tempi di attesa non sono ancora ottimizzati.

Gemini 1.5 Pro supera il suo predecessore

Google Gemini | Intelligenza artificiale | Gemini 1.5

Il salto di Gemini dalla versione 1.0 alla 1.5 è semplicemente brutale. Non solo il modello di intelligenza artificiale ottiene risultati simili a Gemini 1.0 Ultra, ma la variante Pro distrugge il suo predecessore.

Secondo Google, Gemini 1.5 Pro supera Gemini 1.0 Pro nell’87% dei casi. benchmark utilizzati per sviluppare i modelli linguistici di grandi dimensioni dell’azienda.. Ciò è dovuto in parte al fatto che Mountain View ha implementato un’architettura MoE (Miscela di esperti) che rende più efficiente il processo di formazione e implementazione dell’IA.

Questo perché Gemini 1.5 non si affida più a una singola rete neurale su larga scala, ma piuttosto a più reti neurali di piccole dimensioni e specializzate in temi specifici. Ciò significa che, a seconda di ciò che gli utenti richiedono, vengono attivate solo le connessioni tra le reti neurali dedicate a quel tipo di conoscenza o a quelle caratteristiche specifiche.

In termini di sicurezza ed etica, Gemini 1.5 segue le stesse linee guida e gli stessi impegni presi per lo sviluppo della versione originale. Google si impegna a continuare a condurre valutazioni in questo senso. Oltre a sviluppare nuovi test incentrati sulle capacità ampliate dell’IA grazie alla sua finestra di contesto più ampia.

Terremo gli occhi aperti per ulteriori notizie sul salto da Gemini Nano y Gemini Ultra alla versione 1.5. Sebbene non sia stato specificato da Google, tutto lascia pensare che Gemini 1.5 Pro arriverà presto sulla versione web del chatbot Gemini (gemini.google.com) e sulle sue versioni per iOS e Android.