L’evoluzione di Siri, e di altri assistenti e servizi vocali come Cortana e Alexa, potrebbe essere limitata dalle tecnologie attuali relative ai microfoni. È quanto spiega un intervento di Bloomberg, pubblicato nella giornata di ieri, sulla base dell’opinione di molti esperti di settore. A quanto pare, lo stato dell’arte attuale dei microfoni, almeno a livello mobile, non permetterebbe grandi ampliamenti delle capacità di comprensione da parte degli assistenti intelligenti dei sistemi operativi.
Sebbene le tecnologie impiegate per lo sviluppo degli smartphone migliorino sensibilmente di anno in anno, dai sensori alle fotocamere, i microfoni rimangono da anni sostanzialmente inalterati. Questa condizione renderebbe difficile il filtraggio della voce rispetto ai rumori di fondo o ambientali, nonostante negli anni si siano sviluppate le più disparate tecnologie di noise filtering, limitando le evoluzioni potenziali degli assistenti vocali quali Siri. Allo stesso tempo, però, il crescente interesse nei confronti dell’intelligenza artificiale, nonché per i servizi vocali integrati, porterà giocoforza il mercato a migliorarsi.
Marwan Boustany, analista per IHS Markit, ha spiegato come “la performance dei microfoni non sia migliorata molto” dal 2012, anno di lancio di iPhone 5. Questa interpretazione sembra essere indirettamente confermata da Craig Federighi, senior vice president del Software Engineering di Apple, il quale in una recente intervista aveva spiegato come la qualità del microfono influisca in modo importante sulle abilità di Siri:
Non contano solo i circuiti. Conta anche quanti microfoni inseriamo nei device e la loro posizione. Conta come sintonizziamo l’hardware, questi microfoni e il software che gestisce l’audio.
Limitazione del microfono a parte, le capacità di Siri continuano a crescere di giorno in giorno: proprio questa settimana, ad esempio, è emerso come l’assistente vocale di Apple abbia potuto godere di un incredibile miglioramento grazie all’introduzione di tecnologie di “machine learning”, che hanno permesso al sistema di ridurre fortemente il livello d’errore e il tasso in percentuale delle frasi non correttamente interpretate.