Il fronte di battaglia più sanguinoso dell’intelligenza artificiale: i generatori di video

L’ascesa dell’intelligenza artificiale generativa ha raggiunto il suo apice nella diffusione dei generatori di video. Generatori di video AI. Questo settore vede la partecipazione stellare dei due giganti del settore, OpenAI e Google. Non saranno soli: abbiamo già visto sviluppi pronti a competere con loro. In effetti, le promesse di questi modelli sono tanto affascinanti quanto terrificanti. E la battaglia si preannuncia cruenta, come prevede il titolo di questa recensione.

Per gli ignari, questo è sistemi in grado di generare video a partire da messaggi scritti.. Ad esempio, l’utente richiede – con un testo – una clip che mostri centinaia di aeroplani di carta, di colori diversi, che sorvolano un paesaggio boscoso. In un batter d’occhio, i nuovi modelli creeranno un video che mostra quella scena. È una tecnologia impressionante, che sembra uscita da una favola di fantascienza. Ma non è tutto roseoIl rischio più rilevante e generale: la sofisticazione dell’inganno. Il rischio più rilevante e generale è la sofisticazione dell’inganno.

Finora quest’anno, OpenAI e Google presentano i propri generatori di video AI, Sora e Veo, rispettivamente Sora e Veo. Tuttavia, non li hanno ancora lanciati e sostengono che l’attesa è necessaria, non solo per perfezionare il funzionamento dei sistemi. Hanno anche riconosciuto i pericoli associati al loro uso e l’importanza di prendere tutte le precauzioni prima di rendere questi progressi disponibili al grande pubblico.

Sora di OpenAI, un pioniere tra i generatori di video AI

La clip sopra questo paragrafo è stata creata con Sora. OpenAI – un’organizzazione che ha raggiunto la fama mondiale quando ha lanciato il progetto bot ChatGPT- assicura che per il video non sono state utilizzate registrazioni precedenti e che non sono state effettuate modifiche successive. Come indicato in precedenza, il magia di generazione si basa esclusivamente su indicazioni scritte, “suggerimenti“nel gergo dell’intelligenza artificiale.

LEGGI  Il CEO di Twitter mostra la schermata iniziale del suo iPhone con le sue applicazioni preferite. Manca la più importante

Sora, un pioniere tra i generatori di video AI, è in grado di creare pezzi altamente realistici, animazioni e scene surreali. Le possibilità sono vaste, secondo OpenAI ha promesso nel comunicato stampa dell’annuncio. Il sistema è “in grado di generare filmati complessi, con più personaggi, movimenti specifici e dettagli precisi”. Inoltre, hanno osservato che “il modello non solo capisce ciò che l’utente chiede, ma anche come le cose esistono nel mondo fisico”.

Il filmato che segue è un’ulteriore dimostrazione di questa bontà. Per questo filmato, un prompt relativamente ampio e dettagliato. “Un diorama meticolosamente realizzato che raffigura una scena serena del Giappone del periodo Edo. Architettura tradizionale in legno. Un samurai solitario, vestito con un’intricata armatura, cammina lentamente per la città”.

Non abbiamo torto nel dire che questa tecnologia è l’evoluzione della imagertra cui DALL-E, sempre di OpenAI. Indubbiamente, l’aggiunta del movimento alle scene descritte rappresenta un’ulteriore sfida. Per raggiungere questo obiettivo, il modello è stato addestrato con grandi volumi di informazioni, in questo caso una vasta libreria di video correttamente etichettati. Alcuni dettagli: Sora crea pezzi lunghi fino a 60 secondi, consente l’aggiunta di audio e può lavoro con clip sia verticali che orizzontali.

Come abbiamo notato – e ne parleremo in dettaglio più avanti in questa recensione -. il generatore di video AI di OpenAI non è ancora stato rilasciato al pubblico.. “Avremo diverse misure di sicurezza prima che sia disponibile”, ha dichiarato il gruppo guidato da Sam Altman. Nel frattempo, sulle piattaforme ufficiali troviamo bellissime creazioni con Sora, che nella sua prima versione è nelle mani di un gruppo selezionato di utenti. Si tratta di registi, esperti di AI e professionisti del settore audiovisivo, ai quali l’organizzazione si rivolge per ricevere feedback e perfezionare i dettagli necessari prima del lancio.

LEGGI  La legge europea sui Cavalieri è oggi un gioco di tutti o di nulla

Quando sarà aperto al pubblico? Sebbene non sia ancora stata annunciata una data ufficiale, la responsabile tecnologica dell’azienda, Mira Murati, ha dichiarato a Il Wall Street Journal che non sarà ritardato oltre l’anno in corso.

Anche Google gioca in questo campionato: ecco le caratteristiche di Veo

OpenAI si mette in mostra con ChatGPT e Google risponde con Bard, il proprio chatbot ora chiamato Gemini. Il team di Altman ha annunciato Sora, e quello di Sundar Pichai si è affrettato a mostrare al mondo come utilizzare Veo, il generatore di video AI che si appresta a competere in un settore in cui sicuramente vedremo molto movimento. Il modello è stato annunciato a maggio alla conferenza per sviluppatori Google I/O 2024.

Antonio
WRITTEN BY

Antonio

Ciao, mi chiamo Antonio. Sono uno scrittore di DFO Media e la mia passione è esplorare l'intersezione tra sport e tecnologia. Attraverso i miei scritti, svelo le innovazioni che stanno plasmando il futuro dello sport.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *