Proprio ieri avevamo parlato del nuovo assistente vocale avanzato di OpenAI, disponibile ad oggi solo ad gruppo selezionato di abbonati ChatGPT Plus. Questo assistente vocale ha stupito per diversi motivi, non solo per il modo in cui recepiva istantaneamente il linguaggio naturale attraverso il quale veniva ingaggiato, ma anche il modo in cui modulava la voce, rispondendo perfettamente a tono alle interruzioni continue dei propri “esaminatori” umani. Una performance ineccepibile (visibile sul profilo Instagram di The Verge), che ha stupito per la perfezione “lato tecnico” ma che certamente non si può definire inquietante. Inquietante è l’aggettivo giusto per il risultato del nuovo test effettuato da Cristiano Giardina e pubblicato sul suo profilo X.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
Giardina ha chiesto al chatbot di contare fino a 10, prima piano, poi sempre più velocemente. Nessun problema, a parte il fatto che anche l’intelligenza artificiale non è riuscita complice la velocità a scandire bene i numeri. E questo è già un primo segnale… Poi Giardina gli ha chiesto di contare sino a 5o, sempre velocemente. Qui è scattata quello che gli anglosassoni chiamano Uncanny Valley, ovvero quel disagio che spesso proviamo quando osserviamo robot o oggetti simili all’uomo che appaiono quasi realistici, ma non del tutto, causando una sorta di repulsione emotiva, col cervello che di fatto non riesce a capire se quello che stiamo osservando sia reale o no. Una situazione da manuale è quella degli attori generati completamente in computer grafica, iperrealistici ma non troppo, dove la mimica facciale in cgi li tradisce, visto che ad oggi non può reggere il confronto con quella naturale. Qualcuno oltre a inquietante suggerisce anche il termine disturbante, probabilmente molto più appropriato.
Il chatbot, da consumato attore, o da umano in fieri, una volta arrivato a trenta ha ripreso fiato, rallentando su i primi due numeri successivi per poi correre sino a 50 come gli era stato detto di fare. L’intelligenza artificiale replica quindi il comportamento umano in tutto e per tutto, anche in situazioni in cui data la sua natura artificiale non dovrebbe incappare. I confini, anzi le certezze con cui si è soliti distinguere l’umano dall’intelligenza artificiale sono sempre più labili. Se non è inquietante questo!
ChatGPT Advanced Voice Mode counting as fast as it can to 10, then to 50 (this blew my mind – it stopped to catch its breath like a human would) pic.twitter.com/oZMCPO5RPh
— Cristiano Giardina (@CrisGiardina) July 31, 2024