L’assistente Google Now, che oggi richiede obbligatoriamente una connessione Internet per poter esprimere al meglio le proprie potenzialità, in un futuro non troppo lontano potrebbe operare in maniera efficiente anche in modalità offline. È quanto emerge da un documento redatto dal team Research del gruppo di Mountain View, intitolato “Personalized Speech Recognition on Mobile Devices”, ovvero “Riconoscimento Vocale Personalizzato sui Dispositivi Mobile”.
Si fa riferimento ad una novità che sarà presentata ufficialmente nei prossimi giorni, in occasione dell’evento ICASSP 2016 (International Conference on Acoustics, Speech and Signal Processing) in scena a Shanghai. In breve, si tratta di un sistema in grado di effettuare il riconoscimento vocale anche senza una connessione Internet (ovvero senza connettersi ai server di bigG per l’analisi del flusso audio), con una precisione piuttosto elevata, grazie al salvataggio di un sistema all’interno del dispositivo. I test effettuati riportano un margine di errore pari al 13,5% delle parole contenute in un dettato, occupando solo 20,3 MB di storage su un Nexus 5 con processore da 2,26 GHz e 2 GB di RAM.
La tecnologia consentirà, ad esempio, di dettare il testo di un’email mentre ci si trova in volo e di inoltrare poi il messaggio non appena si aggancia una rete, semplicemente pronunciando la frase “Invia un’email a Mario Rossi: ci incontriamo questa sera alle otto”. Al momento non è dato a sapere se e quando la tecnologia verrà messa a disposizione di tutti gli utenti. Per la realizzazione il team impegnato sul progetto ha fatto ricorso all’analisi di circa 2.000 ore di ricerche vocali (anonime), per un totale pari ad oltre tre milioni di espressioni, aggiungendo al segnale audio rumore di fondo prelevato dai video in streaming su YouTube, così da simulare al meglio le reali condizioni di utilizzo.