Destino ha cambiato la storia dei videogiochi alla sua uscita nel 1993 ed è diventato uno dei titoli più venerati dagli appassionati. La sua capacità di funzionare sui dispositivi più insoliti gli ha permesso di fare notizia innumerevoli volte nel corso della sua storia, e ora è tornato al centro della scena grazie a GiocoNGenun’IA generativa che può simulare in tempo reale.
Ricercatori di Google Research, Google DeepMind e dell’Università di Tel Aviv si sono occupati di di creare questa particolare tecnologia. Gli autori dell’articolo definiscono GameNGen come “il primo motore di gioco guidato interamente da un modello neurale che consente l’interazione in tempo reale con un ambiente complesso su lunghe traiettorie con un’elevata qualità”.
Che cosa significa? In termini semplici, che hanno sviluppato una versione giocabile di Doom i cui livelli e giochi sono creati in tempo reale utilizzando l’IA generativa.. I risultati sono davvero sorprendenti, tanto che a prima vista non è possibile distinguere quali video corrispondano alle gameplay del gioco originale di id Software e quali corrispondono a GameNGen.
L’intelligenza artificiale può simulare Destino a oltre 20 fotogrammi al secondo utilizzando una singola unità di elaborazione tensoriale (TPU). Questa tecnologia crea ogni fotogramma del gioco in tempo reale, prevedendo il fotogramma successivo. fotogramma con un rapporto segnale/rumore massimo (PSNR) pari a 29,4. Gli esperti indicano che questo risultato è paragonabile a quello ottenuto con la compressione con perdita JPEG.
GameNGen, l’intelligenza artificiale generativa che simula Doom in tempo reale
La cosa più spettacolare di GameNGen è che, come abbiamo già detto, non si limita a generare una demo video di Doomma permette di giocarci. Naturalmente, non è la prima volta che l’intelligenza artificiale viene applicata a settori legati allo sviluppo di videogiochi. Come spiegato da Ars TechnicaIl rendering neurale e la creazione o simulazione di mondi sono stati studiati per molto tempo.
Ciò che colpisce particolarmente in questo caso, tuttavia, è che il lavoro dei ricercatori di Google e dell’Università di Tel Aviv utilizza come punto di partenza un’intelligenza artificiale ben nota nel campo della generazione di immagini: Diffusione stabile.
Per creare GameNGen, gli autori del progetto hanno addestrato un agente di apprendimento per rinforzo in modo che potesse giocare a Doom e hanno registrato le loro partite. Hanno poi utilizzato i filmati per addestrare un modello di intelligenza artificiale basato su Stable Diffusion 1.4, che è responsabile della previsione dei fotogrammi successivi durante una sessione di gioco.
Una tecnologia promettente
Uno dei problemi affrontati dagli esperti è stato il seguente come preservare la stabilità visiva per lunghi periodi di tempo.. Per farlo, hanno scelto di introdurre un rumore gaussiano nei fotogrammi del filmato usato per addestrare l’intelligenza artificiale, insegnandole a correggerlo.
Gli sviluppatori hanno fatto notare che la previsione dei fotogrammi non è perfetta e che ci sono imprecisioni visibili quando si tratta di piccoli dettagli. Questo si nota soprattutto nella barra inferiore del Destinodove si contano le munizioni, la salute, ecc.
Tuttavia, i creatori di questa IA generativa hanno ottenuto risultati notevoli. Infatti, quando GameNGen viene presentato in brevi filmati, è piuttosto difficile riconoscere se si tratta di una simulazione di Doom o il gioco vero e proprio. Questo spiega nella sezione carta dei ricercatori:
“Come ulteriore misura della qualità della simulazione, abbiamo fornito a 10 valutatori umani 130 brevi clip casuali, di [entre] 1,6 secondi e 3,2 secondi, della nostra simulazione e del gioco reale. I valutatori avevano il compito di riconoscere il gioco reale. I valutatori hanno preferito il gioco reale alla simulazione solo nel 58% o 60% dei casi. [según la duración]”.
Resta da vedere come si evolverà questa tecnologia e se potrà essere applicata allo sviluppo di nuovi giochi. Mentre GameNGen può simulare Doom In tempo reale con risultati spettacolari, è logico pensare che potrebbe non essere così facile da implementare su scala più ampia. Non solo perché potrebbe non essere disponibile tanto materiale di formazione, ma anche perché probabilmente sarebbe richiederebbe una potenza di calcolo inaccessibile..