Google aggiorna Gemini per generare immagini più realistiche delle persone

Google renderà nuovamente possibile la generazione di immagini con l’intelligenza artificiale di Gemini. Dopo la polemica del monarca inglese nero o dei nazisti asiatici, l’azienda tecnologica ha ritirato la sua AI generativa a febbraio. Dopo mesi di test e correzioni, Gemini torna in auge e promette immagini fotorealistiche delle persone da un’istruzione di testo.

Il gigante tecnologico ha confermato un importante aggiornamento ai suoi modelli linguistici, tra cui la capacità di generare immagini con Image 3. Annunciato all’I/O 2024, Image 3 è un nuovo modello per generare immagini realistiche a partire dal testo. Gli utenti sono tenuti a inserire solo un’istruzione (prompt) allo stesso modo in cui lo facciamo con Gemini o ChatGPT.

L’immagine 3 utilizza il linguaggio naturale, in modo che gli utenti possono scrivere una descrizione dettagliata come desiderano. Sebbene Google abbia mostrato i suoi progressi durante la conferenza degli sviluppatori, non ha confermato una data di rilascio. La buona notizia è che questo modello sarà disponibile per tutti gli utenti.

“In un’ampia gamma di test, Image 3 ha ottenuto risultati positivi rispetto ad altri modelli di imaging”, ha dichiarato Dave Citron, direttore della gestione dei prodotti di Gemini. “Come per Image 2, utilizziamo SynthID, il nostro strumento di etichettatura delle immagini generato dall’intelligenza artificiale”.

Immagine generata dall'intelligenza artificiale Gemini Immagine 3

Immagine generata dall'AI Immagine 3 di Gemini

Cosa accadrà alle immagini controverse di Gemini?

Secondo Google, Image 3 offre funzionalità di imaging avanzate con protezioni integrate. L’azienda tecnologica afferma in un libro bianco che monitorava attivamente le violazioni delle politiche di sicurezza e di contenuto.. Gli ingegneri hanno utilizzato un classificatore multimodale per rilevare le immagini che risultavano in una rappresentazione dannosa.

Quest’ultima funziona anche per evitare contenuti con “inesattezze storiche”.. Google ha ben chiaro che la sua tecnologia deve evitare di creare o rafforzare pregiudizi ingiusti, ma non può farlo a costo di commettere errori come quello del re nero d’Inghilterra.

Immagine generata dall'intelligenza artificiale Immagine 3 di Gemini — Gemini continua a produrre inesattezze storiche

Immagine generata dall'IA Immagine 3 di Gemini — Gemini continua a produrre inesattezze storiche

“Abbiamo valutato le prestazioni di Image 3 su diversi dataset di sicurezza con filtri di sicurezza raccomandati rispetto alle prestazioni di Image 2”, ha dichiarato Google. “Questi set di dati sono destinati a valutare la violenza, l’odio, la sessualizzazione esplicita e l’ipersessualizzazione nelle immagini generate dall’IA”. Secondo l’azienda, la percentuale di violazioni rimane uguale o inferiore a quella di Immagine 2.

LEGGI Gli hacker possono accedere alle chat di ChatGPT o Copilot, anche se sono criptate.

È importante ricordare che L’immagine 3 non sarà priva di errori. Google avverte che non tutte le immagini generate dalla sua AI saranno perfette, anche se ha chiarito che non vedremo contenuti sessuali o violenti. Tutte le immagini di minori o di scene eccessivamente cruente, violente o sessuali saranno vietate, così come la generazione di persone fotorealistiche riconoscibili.

Google ha confermato che Image 3 sarà disponibile nei prossimi giorni per gli utenti di Gemini Advanced.. La generazione di immagini fotorealistiche delle persone non sarà implementata inizialmente, anche se si dice che debutterà tra pochi giorni per gli abbonati a pagamento e per le aziende.