Stability AI, i creatori del popolare generatore di immagini Stable Diffusion, ha appena presentato il suo strumento per i video alimentato dall’intelligenza artificiale. Stable Video Diffusion è ora disponibile in una versione limitata per i ricercatori. L’azienda lo promuove come un sistema all’avanguardia in grado di generare video ad alta risoluzione.
“Questo modello video di intelligenza artificiale generativa di nuova generazione rappresenta un passo importante nel nostro percorso verso la creazione di modelli per tutti e di ogni tipo”, ha dichiarato Stability AI in un comunicato. Diffusione video stabile viene rilasciato sotto forma di due modelli immagine-video: ciascuno dei quali è in grado di generare 14 e 25 fotogrammi, con una frequenza di fotogrammi personalizzabile tra 3 e 30 fotogrammi al secondo.
Si basa sul modello di immagine Stable Diffusion, che si è guadagnato popolarità e alcune cause legali per aver utilizzato dati protetti da copyright per il suo addestramento. Stability AI ha spiegato che l’addestramento del nuovo sistema video è passato attraverso tre fasipre-addestramento testo-immagine, pre-addestramento video e messa a punto di video di alta qualità.
L’azienda sostiene che il suo strumento è risultato superiore ai concorrenti commerciali RunwayML e Pika Labs negli studi sulle preferenze degli utenti. Stability AI ha spiegato che è disponibile come modello open source all’indirizzo GitHub e ha chiarito che non è ancora destinato a una soluzione commerciale o di uso pubblico. La versione limitata per i ricercatori consentirà di perfezionare gli aspetti di qualità e sicurezza prima del rilascio generale.
Stability AI lancerà una piattaforma web per la generazione di video
Stability AI sottolinea che il suo modello video può essere facilmente adattato ad una varietà di compiti successivi. Ad esempio, la sintesi di più viste da una singola immagine e la messa a punto su set di dati multi-vista. “Stiamo progettando una serie di modelli che si basano ed estendono questa base, in modo simile all’ecosistema che è stato costruito intorno alla Diffusione Stabile”, ha dichiarato.
L’azienda ha anche reso disponibile un lista d’attesa di una nuova piattaforma web, che includerà un’interfaccia testo-video. “Questo strumento mostrerà le applicazioni pratiche della diffusione video stabile in numerosi settori, tra cui la pubblicità, l’istruzione, l’intrattenimento e altri ancora”, ha aggiunto.
Stability AI ha lanciato Stable 3D all’inizio del mese.. Si tratta di un’applicazione basata sull’intelligenza artificiale che genera oggetti 3D testurizzati per piattaforme di modellazione e sviluppo di giochi. Questo strumento è disponibile in anteprima privata per i clienti. L’azienda ha evidenziato nel suo blog che è stato progettato per consentire ai non esperti di generare modelli 3D di qualità “in pochi minuti”.
Il La controversia sul copyright di Stable Diffusion continua a mietere vittime. Uno dei suoi vicepresidenti, Ed Newton-Rex, si è dimesso questo mese da direttore del settore audio di Stability AI. Non era d’accordo con la posizione dell’azienda secondo cui l’addestramento con opere protette da copyright è un “uso corretto”. Questa posizione gli è valsa una battaglia in tribunale con Getty Images, una delle principali agenzie fotografiche del mondo.