Google lancia Gemini 1.5 e distrugge OpenAI e GPT-4

Google ha appena introdotto Gemini 1.5il primo importante aggiornamento del suo modello di intelligenza artificiale di nuova generazione. E promette di mettere in crisi sia OpenAI che GPT-4. Questa nuova versione sarà inizialmente disponibile per gli sviluppatori e i clienti aziendali, mentre il pubblico in generale arriverà presto.

L’evoluzione di Gemini verso la versione 1.5 è stata portata da Gemini 1.5 Pro. Si tratta della variante AI general-purpose che, ad esempio, alimenta Gemini, il chatbot precedentemente noto come Bard, che è arrivato anche a sostituire Google Assistant. Per il momento, Mountain View non si è espressa su quando Gemini Nano e Gemini Ultra saranno aggiornati alla versione 1.5.

Uno dei primi punti di forza di Gemini 1.5 è che promette un formidabile salto di prestazioni in ambito Pro rispetto all’originale. Gli sviluppatori di questa tecnologia affermano che raggiunge risultati simili a Gemini 1.0 Ultrapur consumando meno risorse computazionali.

Un altro elemento che Google ha evidenziato è che Gemini 1.5 Pro è dotato di una finestra contestuale di 1 milione di gettoniChe cosa significa? Che l’intelligenza artificiale può raccogliere molte più informazioni contemporaneamente e comprendere richieste molto più complesse. Secondo i californiani, questa è la finestra di contesto più ampia di qualsiasi modello fondamentale rilasciato finora, indipendentemente dalla scala.

La più grande finestra di contesto mai vista in un modello fondazionale

Gemelli a Bard

Vale la pena notare che il milione di token non sarà immediatamente disponibile per tutti gli utenti. Google vi farà pagare per accedere a questa funzione. Inizialmente, Gemini 1.5 Pro offrirà una finestra di contesto di 128.000 gettoni, la stessa attualmente fornita da GPT-4 Turbo. L’azienda introdurrà poi una scala di prezzi per opzioni più ampie, fino a 1 milione di gettoni.

LEGGI  L'intelligenza artificiale di NVIDIA migliora i vecchi video di YouTube e li riproduce in 4K

Per comprendere meglio l’importanza di questo problema, è importante ricordare che la versione 1.0 di Gemini Pro aveva una finestra di contesto di soli 32.000 gettoni. Claude 2.1 di Anthropic aveva 200.000 token. Ma Google non si è fermata a 1 milione di token. L’azienda afferma che durante la ricerca e lo sviluppo di Gemini 1.5 Pro hanno sperimentato fino a 10 milioni di.

Cosa si può ottenere con 1M di token? Secondo Google, Gemini 1.5 Pro può elaborare al volo “1 ora di video, 11 ore di audio e basi di codice con 300.000 linee di codice o più di 700.000 parole”. Nel video qui sotto, ad esempio, l’IA mostra come può risolvere problemi in un blocco con più di 100.000 linee di codice:

Video YouTubeVideo di YouTube

La nuova versione dell’intelligenza artificiale sviluppata a Mountain View è stata notata anche per la sua maggiore capacità di ragionamento. Secondo i suoi creatori, è in grado di comprendere grandi volumi di informazioni, come documenti di centinaia di pagine, per analizzarli, riassumerli o contrassegnare porzioni specifiche, a partire da una singola richiesta o da un’altra. pronta. Lo stesso vale quando si tratta di video, dove è possibile identificare gli elementi di un clip sia dalle descrizioni testuali che dalle immagini.

Alcuni fortunati stanno già testando Gemini 1.5 Pro con una finestra di contesto di 1 milione di token in via preliminare. Questo viene fatto con clienti e sviluppatori selezionati via Vertex AI y Studio AI. Anche se Google ha spiegato che si tratta di una funzione sperimentale e che i tempi di attesa non sono ancora ottimizzati.

Gemini 1.5 Pro supera il suo predecessore

Google Gemini | Intelligenza artificiale | Gemini 1.5Google Gemini | Intelligenza artificiale | Gemini 1.5

Il salto di Gemini dalla versione 1.0 alla 1.5 è semplicemente brutale. Non solo il modello di intelligenza artificiale ottiene risultati simili a Gemini 1.0 Ultra, ma la variante Pro distrugge il suo predecessore.

Secondo Google, Gemini 1.5 Pro supera Gemini 1.0 Pro nell’87% dei casi. benchmark utilizzati per sviluppare i modelli linguistici di grandi dimensioni dell’azienda.. Ciò è dovuto in parte al fatto che Mountain View ha implementato un’architettura MoE (Miscela di esperti) che rende più efficiente il processo di formazione e implementazione dell’IA.

Questo perché Gemini 1.5 non si affida più a una singola rete neurale su larga scala, ma piuttosto a più reti neurali di piccole dimensioni e specializzate in temi specifici. Ciò significa che, a seconda di ciò che gli utenti richiedono, vengono attivate solo le connessioni tra le reti neurali dedicate a quel tipo di conoscenza o a quelle caratteristiche specifiche.

In termini di sicurezza ed etica, Gemini 1.5 segue le stesse linee guida e gli stessi impegni presi per lo sviluppo della versione originale. Google si impegna a continuare a condurre valutazioni in questo senso. Oltre a sviluppare nuovi test incentrati sulle capacità ampliate dell’IA grazie alla sua finestra di contesto più ampia.

Terremo gli occhi aperti per ulteriori notizie sul salto da Gemini Nano y Gemini Ultra alla versione 1.5. Sebbene non sia stato specificato da Google, tutto lascia pensare che Gemini 1.5 Pro arriverà presto sulla versione web del chatbot Gemini (gemini.google.com) e sulle sue versioni per iOS e Android.

Elaborazione…

Hai finito! Ora siete iscritti

Si è verificato un errore, aggiornare la pagina e riprovare.

Anche in Hipertextual:

Antonio
WRITTEN BY

Antonio

Ciao, mi chiamo Antonio. Sono uno scrittore di DFO Media e la mia passione è esplorare l'intersezione tra sport e tecnologia. Attraverso i miei scritti, svelo le innovazioni che stanno plasmando il futuro dello sport.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *