Microsoft Research Asia, uno dei più grandi laboratori di ricerca del colosso di Redmond, è al lavoro su un progetto a dir poco avveniristico che sembrava potesse far parte ancora soltanto di una prodigiosa storia di fantascienza. Invece, presso i laboratori asiatici è in lavorazione una tecnologia che permetterà la traduzione vocale istantanea da e in ventisei lingue differenti, con l’obiettivo di rivoluzionare per sempre la comunicazione a livello globale senza che nessuno debba sforzarsi di imparare necessariamente l’idioma del suo interlocutore.
A capo del progetto nel reparto di Pechino c’è Frank Soong, il quale ha dato una dimostrazione delle potenzialità del software spiegando come l’idea sia partita affinché Craig Mundie, direttore generale di Microsoft Research Asia, potesse esprimersi nel cinese mandarino. Soong ha mostrato come la voce di Rick Rashid, suo superiore, sia stata tradotta in maniera efficace in spagnolo, italiano e mandarino partendo dall’inglese. Il risultato degli esperimenti è stato pubblicato su Technology Review ed è sinceramente incoraggiante.
Aldilà di qualche leggera defezione sugli accenti, la traduzione in lingua italiana è praticamente impeccabile, specie se si considera che Rashid ha volutamente scandito la frase in inglese con qualche incertezza, così da complicare il lavoro al sistema che non ne ha comunque risentito.
Microsoft è chiaramente orgogliosa del risultato raggiunto ed immagina già in che modo questa tecnologia potrà essere applicata in futuro alla vita di tutti i giorni: da una semplice utilità turistica a sistema che può supportare gli studenti all’apprendimento di nuove lingue oltre a facilitare le comunicazioni tra aziende e manager di tutto il mondo. Gli intenti dei laboratori di ricerca vanno comunque oltre i semplici dialoghi tra esseri umani. Si è parlato infatti, in via sempre ipotetica, dell’installazione del sistema su uno smartphone in modo che, tramite la fotocamera, riesca a tradurre all’utente parole scritte su riviste, giornali o cartelli stradali in altre lingue (espediente in questo caso meno innovativo).
Attualmente, la tecnologia ha bisogno di un’ora per formare un modello in grado di leggere qualsiasi cosa venga espressa da una persona. Questo modello viene poi convertito in modo che possa essere confrontato con quello installato nativamente sul dispositivo nella lingua indicata. Microsoft Research Asia spiega inoltre come l’obiettivo sia non solo quello di tradurre letteralmente quanto detto da un individuo, ma replicarne anche intonazione, accenti e persino eventuali pause o indecisioni. Un piccolo passo verso il futuro e una comunicazione globale più accessibile e immediata.