Che il gruppo di Mountain View stia puntando in modo significativo sul riconoscimento vocale è fuori discussione. Lo dimostra ad esempio l’impiego del comando “OK Google” in ambito mobile (e non solo), che sta pian piano rivoluzionando il modo di interagire degli utenti con i propri dispositivi. Oggi il motore di ricerca pubblica un interessante filmato da poco più di sette minuti dedicato proprio alle tecnologie di questo tipo.
“Behind the mic: the science of talking with computers” (tradotto “Oltre il microfono: la scienza del parlare con i computer”) tratta proprio la nascita e l’evoluzione dei sistemi che negli ultimi decenni hanno permesso ai calcolatori di interpretare il linguaggio umano, analizzando lo spettro audio di quanto pronunciato e traducendolo in singole parole o intere frasi. Questa la descrizione del video, pubblicato sul canale YouTube di bigG e visibile in streaming di seguito.
Il linguaggio. Semplice da comprendere per gli esseri umani (nella maggior parte dei casi), ma non altrettanto per i computer. Questo è un cortometraggio sul riconoscimento vocale, sulla comprensione del linguaggio, sulle reti neurali e su come utilizzare le nostre voci per comunicare con la tecnologia che ci circonda.
Dai primi esperimenti effettuati all’inizio degli anni ’50 all’assistente virtuale Google Now oggi integrato su milioni di dispositivi mobile, passando per le avveniristiche reti neurali artificiali che cercano di replicare in modo sempre più fedele il processo di apprendimento del cervello umano. Tra le voci autorevoli in materia che intervengono nel filmato anche quella del futurista, inventore e scrittore Ray Kurzweil, che da fine 2012 si è unito al team di Google. Insieme a lui l’ingegnere elettronico genovese Roberto Pieraccini, autore negli anni scorsi del volume “The Voice in the Machine: Building Computers That Understand Speech”.