Di video cosiddetti deepfake ormai se ne sono visti parecchi: si tratta di una tecnologia che grazie all’intelligenza artificiale consente di creare video falsi con personaggi reali. Ad esempio si può inserire il viso di Nicolas Cage sul corpo di un altro attore, per non parlare dell’utilizzo di questa tecnologia nel settore della pornografia. Nuove tecnologie si affacciano praticamente ogni giorno, ma l’ultima appare davvero inquietante.
Si tratta di uno studio della Stanford University, Max Planck Institute for Informatics, Princeton University e Adobe Research, di cui è stato rilasciato un video piuttosto esplicativo. Si tratta in sostanza di modificare con estrema facilità ciò che le persone dicono in video. Un persona che quindi dice “Adoro l’odore del napalm al mattino”, frase celebre del film Apocalypse Now, può essere trasformata in “Adoro l’odore del toast francese al mattino”, con tanto di labiale.
Chiaramente è ancora un prototipo, ma si può già immaginare che un servizio del genere possa essere perfezionato relativamente nel breve periodo. Per esempio Adobe ha già condiviso i dettagli sul software prototipo denominato VoCo, che consente agli utenti di modificare le registrazioni vocali con la stessa facilità con cui si scattano le foto e che inoltre è stato utilizzato in questa ricerca.
Per la creazione di questi video fasulli i ricercatori hanno unito diverse tecniche: per prima cosa si procede con una scansione del video che isolano i fonemi parlati del soggetto da modificare. Si abbinano questi fonemi alle espressioni facciali, poi si crea un modello 3D della parte inferiore del volto. Quando viene modificato il testo del video, il software unisce i dati raccolti in precedenza per costruire nuove riprese.
Insomma si digita il testo e il soggetto “dice” ciò che vogliamo. Sono stati effettuati dei test su 138 volontari: il 60% ha creduto alle modifiche.