OpenAI lancia Point-E, un DALL-E per generare modelli 3D a tempo di record

OpenAI, la società fondata da Elon Musk per sviluppare l’intelligenza artificiale, ha un nuovo strumento. Dopo il successo di DALL-E – l’intelligenza artificiale che genera immagini – e di ChatGPT, la sua controparte che genera testi e risposte naturali, stanno ora lanciando Point-E. Il suo scopo è molto chiaro: rivoluzionare il mondo della modellazione 3D.

Oggi l’industria delle immagini 3D generate al computer è una delle più grandi. Sono utilizzati quasi ovunque. Nella progettazione edilizia e architettonica, nella produzione di film e serie, nei videogiochi e molto altro ancora.. Con Point-E, OpenAI promette di rivoluzionare l’uso e lo sviluppo di questi modelli tridimensionali, semplificandone notevolmente la creazione.

Anche se OpenAI non è il primo a sviluppare un’intelligenza artificiale in grado di generare immagini 3D, è una delle proposte più sorprendenti. A differenza di concorrenti come DreamFusion di Google, Point-E è uno strumento molto più leggero in termini di consumo di risorse.. Pertanto, è in grado di fornire risultati in tempi significativamente inferiori.

Point-E può produrre “nuvole di punti 3D” che generano l’immagine desiderata.. In questo modo, riducono il tempo di attesa dei concorrenti, che di solito impiegano ore per visualizzare un risultato, a un minuto o due per ogni modello generato.

“Il nostro metodo genera prima una singola vista sintetica usando un modello di diffusione da testo a immagine, e poi produce una nuvola di punti 3D usando un secondo modello di diffusione che condiziona l’immagine generata”.

OpenAI

Point-E, una tecnologia di generazione di modelli 3D che si basa su tecnologie più tradizionali.

La tecnologia utilizzata per ottenere i risultati di Point-E è davvero impressionante. Il modello Il modello si ispira direttamente ad altri modelli di immagini 2D più tradizionali, come DALL-E e Craiyon. -precedentemente noto come DALL-E mini-. Questi ultimi sono diventati notevolmente popolari negli ultimi tempi, sorprendendo sempre più gli utenti di Internet con la loro capacità di generazione.

LEGGI  Il GPT-4 supera per la prima volta il test di Turing: cosa implica e perché è così rilevante?

Point-E si basa su questi modelli. Genera un grande compendio di immagini attraverso il testo, per seguire istruzioni più diverse e complesse. A partire da ciò, utilizza un set di coppie più piccolo per generare la nuvola di punti che darà forma alla geometria dell’oggetto 3D.. Inoltre, tutti questi passaggi vengono eseguiti in pochi secondi e il consumo di risorse e l’ottimizzazione sono ridotti al minimo.

Se si vuole generare, ad esempio, l’immagine di un gatto con le cuffie, basta chiedere a Point-E di farlo. Successivamente, verrà generata una vista 3D sintetica del gatto con le cuffie, e quindi creare una nuvola di punti RGB 3D dall’immagine iniziale. In primo luogo, viene prodotto un modello di nuvola piuttosto grossolano di 1.024 punti, dal quale verrà generato un modello più fine di 4.096 punti.

“Sebbene il nostro metodo ottenga risultati peggiori in questa valutazione rispetto a tecniche più avanzate, produce campioni in una piccola frazione di tempo”.

Team OpenAI

Il codice sorgente del progetto è già disponibile su Github, quindi se volete dargli un’occhiata, basta andare sul repository. È solo questione di tempo prima di vedere nuove proposte basate su Point-E.e sempre più in grado di generare immagini tridimensionali in pochi minuti.

Guida ai regali di Natale 2022

Antonio
WRITTEN BY

Antonio

Ciao, mi chiamo Antonio. Sono uno scrittore di DFO Media e la mia passione è esplorare l'intersezione tra sport e tecnologia. Attraverso i miei scritti, svelo le innovazioni che stanno plasmando il futuro dello sport.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *