Gemini è il fulcro dell’I/O 2024. L’intelligenza artificiale di Google è stata integrata in tutti i suoi servizi e ha presentato una versione che raddoppia le capacità di Gemini 1.5 Pro. La ciliegina sulla torta è una versione più robusta su Android alimentata da Gemini Nano e dall’app ufficiale.
Sameer Samat, presidente dell’ecosistema Android, citato che l’azienda ha intrapreso un viaggio pluriennale per reimmaginare Android con l’intelligenza artificiale al centro. Il primo passo consiste nel tre funzionalità che saranno integrate nel sistema operativo per renderlo più intelligente. La prima è Circle to Search, una funzione disponibile sui Pixel e sui Samsung Galaxy che consente di cercare in tempo reale ciò che si vede sullo schermo.
Questa funzione è già dotata di traduzione a schermo intero e ora ne verrà aggiunta una nuova per aiutare a svolgere i compiti di matematica e fisica. Questa nuova funzione è pensata per gli studenti e consiste in analizzare e risolvere problemi ancora più complessi che coinvolgono formule simboliche, diagrammi, grafici e altro ancora. Google ha promesso di raddoppiare la disponibilità a oltre 200 milioni di dispositivi entro la fine dell’anno.
Ciò è reso possibile da LearnLM, una famiglia di modelli di intelligenza artificiale incentrati sull’apprendimento. LearnLM è stato progettato per integrare la ricerca sulla scienza dell’apprendimento con i prodotti di Google. Secondo l’aziendaquesto modello mira a rendere le esperienze di apprendimento più utili e coinvolgenti.
Gemini sostituirà l’Assistente Google su Android
Un’altra colonna portante della trasformazione di Android è rendere Gemini l’assistente predefinito. L’acquisizione dell’Assistente Google è stata scontata sin dalla comparsa dell’IA e diventerà realtà tra qualche mese. Samat ha annunciato che gli utenti potranno configurare il proprio telefono in modo da utilizzare Gemini come assistente personale per accedervi in qualsiasi momento.
Gemini verrà visualizzato sopra le app, consentendo di interagire con esse e di trascinare i contenuti generati. L’interfaccia di Gemini sarà attivata in modo simile a quella di Google Assistant, premendo la parte inferiore dello schermo, e non sarà necessario cambiare app per utilizzarla.
In una delle dimostrazioni, David Burke, responsabile dell’ingegneria di Google, ha mostrato come sia possibile generare immagini e inviarle tramite Messaggi. Sarà inoltre possibile chiedere a Gemini un video di YouTube o di analizzare un PDF per trovare informazioni specifiche.
Queste funzionalità saranno abilitate nei prossimi mesi in Gemini per Android, in modo che gli utenti possano utilizzarlo sui dispositivi compatibili.
Gemini Nano diventerà più potente nel suo prossimo aggiornamento
Il terzo pilastro della trasformazione riguarda Gemini Nano, il modello fondamentale che consente di eseguire attività di intelligenza artificiale direttamente sul dispositivo. Google ha in programma di potenziarne le capacità e ha annunciato che la prossima versione di Nano sarà multimodale. Ciò significa che il telefono comprenderà testo, immagini, video e suoni.
Un esempio della sua integrazione sarà TalkBack, una funzione che fornisce descrizioni di un’immagine alle persone con problemi di vista. Poiché molte immagini sul web non hanno un attributo che le descriva, l’intelligenza artificiale di Gemini Nano svolgerà questo compito anche in assenza di connessione a Internet.
Il capacità multimodale in arrivo su Gemini Nano nel corso dell’anno e debutterà sul Pixel 9 e sui dispositivi futuri.