Skype ha permesso di eliminare le barriere geografiche, consentendo alle persone di comunicare con testo, audio e video in tutto il mondo. Skype Translator elimina l’ultima barriera, quella che impediva finora di parlare con utenti di altri paesi, senza cambiare lingua. Microsoft ha annunciato l’avvio della prima fase del programma preview con il supporto di due lingue (inglese e spagnolo) per le chiamate audio/video e di oltre 40 lingue per le conversazioni testuali. L’app è compatibile con Windows 8.1 e Windows 10 Technical Preview.
Con Skype Translator, il traduttore universale di Star Trek è quindi una realtà. Il servizio permette di parlare un’altra lingua senza conoscerla, grazie ad anni di ricerca nel campo del riconoscimento vocale, della traduzione automatica e del machine learning. La tecnologia diventa sempre più smart con l’utilizzo dell’app da parte degli utenti. L’infrastruttura è infatti basata su reti neurali “addestrate” per comprendere il linguaggio naturale, spesso molto diverso dalla lingua scritta. Nel video seguente si può vedere e ascoltare una video chiamata tra una studente della Stafford Elementary School di Tacoma (USA) e una studente della Peterson School di Mexico City. La prima parla in inglese, la seconda in spagnolo.
Come funziona
Skype Translator combina machine learning, riconoscimento vocale e traduzione automatica. Per la fase di training della rete neurale sono stati utilizzati dati provenienti da diverse fonti, come pagine web tradotte, video con sottotitoli e precedenti conversazioni one-to-one tradotte e trascritte. Microsoft ha così creato un database composto milioni di campioni audio, molti dei quali offerti volontariamente dai partecipanti ai test. Il software di machine learning costruisce quindi un modello statistico, eliminando le disfluenze, dividendo il testo in frasi e aggiungendo la punteggiatura.
Quando l’utente dice qualcosa, il software cerca le corrispondenze nel suo modello statistico e applica la trasformazione da audio a testo, e da testo a lingua straniera. La traduzione automatica viene effettuata con la stessa tecnologia di Bing Translator, ma addestrata specificamente per comprendere il linguaggio parlato. Le Deep Neural Network progettate da Microsoft Research hanno permesso di ridurre gli errori del riconoscimento vocale, consentendo la conversazione in tempo reale con Skype Translator.