Il progetto si inserisce nel campo emergente del "neural rendering", che mira a riprodurre sia la grafica che le meccaniche di gioco utilizzando l'intelligenza artificiale generativa. GameNGen si basa su una versione modificata di Stable Diffusion 1.4, un modello di diffusione sviluppato da Google per la generazione di immagini.
A differenza di altri sistemi di IA, GameNGen è stato addestrato esclusivamente su video di gameplay di Doom, anziché su dati provenienti da tutto internet. Questo approccio mirato ha permesso al sistema di apprendere l'aspetto visivo e le dinamiche specifiche del gioco.
I ricercatori hanno sottoposto i risultati a un test con valutatori umani, che non sono stati in grado di distinguere le sequenze generate da GameNGen da quelle del gioco originale in oltre la metà dei casi. Questo dimostra l'elevata qualità e fedeltà della simulazione prodotta.
Potenziali applicazioni future
Sebbene lo studio si sia concentrato su Doom, la tecnica potrebbe potenzialmente essere applicata ad altri videogiochi classici. Ciò apre interessanti prospettive per la preservazione digitale dei giochi, la creazione di contenuti e lo sviluppo di nuovi titoli basati su quelli esistenti.
Il Dr. Dani Valevski, uno degli autori dello studio, ha commentato: "GameNGen dimostra come l'IA generativa possa essere utilizzata non solo per creare nuovi contenuti, ma anche per ricreare fedelmente esperienze interattive complesse come i videogiochi".
Tuttavia, gli esperti sottolineano la necessità di considerare attentamente le implicazioni etiche e legali di questa tecnologia, in particolare per quanto riguarda i diritti d'autore e la proprietà intellettuale dei giochi originali.
La ricerca è stata pubblicata sul server di preprint arXiv e rappresenta un importante passo avanti nell'applicazione dell'intelligenza artificiale al mondo dei videogiochi. Ulteriori studi saranno necessari per esplorare appieno le potenzialità e i limiti di questa promettente tecnologia.