A marzo, durante la sua GPU Technology Conference (GTC) a San Jose, in California, Nvidia aveva svelato GauGAN, un sistema di intelligenza artificiale generativa che consente agli utenti di creare immagini di paesaggi realistici che non sono mai esistiti. Nel primo mese dal rilascio della versione beta su Playground, un hub web per l’intelligenza artificiale, GauGAN è stato utilizzato per creare 500.000 immagini tra cui concept art per film e videogiochi. Ora, in coincidenza con la conferenza Siggraph in settimana, la compagnia ha spiegato meglio il fine dell’iniziativa.
GauGAN, il cui nome deriva dal pittore postimpressionista Paul Gauguin, è figlio del sistema Pix2PixHD introdotto lo scorso anno, in grado di creare mondi reali tradotti in immagini. Il modello di apprendimento automatico alla base di GauGAN è stato addestrato su oltre 1 milione di immagini da Flickr, fornendo una comprensione delle relazioni tra oltre 180 oggetti tra cui neve, alberi, acqua, fiori, cespugli, colline e montagne. Una delle referenze, ad esempio, è stata quella di indicare che gli alberi vicino all’acqua generano dei riflessi, che cambiano a seconda della stagione rappresentata.
Nvidia afferma che GauGAN è stato utilizzato da un’organizzazione sanitaria che ne sta esplorando l’uso come strumento terapeutico per i pazienti e da un modellista, Colie Wertz, che ha in portfolio roba come i film di Star Wars, Transformers e Avengers.
Vogliamo avere un impatto con la nostra ricerca. Questo lavoro crea un canale in cui le persone possono esprimere la propria creatività e realizzare opere d’arte che sarebbero impossibili senza l’AI. Una sorta di sfogo verso la propria immaginazione.
Nvidia è anche dietro lo sviluppo di StyleGAN, che può generare immagini realistiche di persone che non sono mai esistite. Lo scorso settembre, i ricercatori della compagnia hanno descritto in un documento accademico un sistema in grado di realizzare scansioni sintetiche del cancro al cervello. E a dicembre, Nvidia ha dettagliato un modello generativo capace di creare ambienti virtuali usando video dal mondo reale.