Intelligenza artificiale, machine learning, reti neurali, algoritmi, machine vision. Termini che stanno entrando prepotentemente a far parte del vocabolario di tutti coloro che si interessano di nuove tecnologie. Sono le fondamenta sulle quali costruire piattaforme e servizi, strumenti in grado di migliorare l’esperienza offerta da dispositivi di ogni tipo, a partire dagli smartphone che ogni giorno portiamo con noi in tasca.
Machine learning, I.A. e reti neurali
Innanzitutto, è bene non fare confusione. L’intelligenza artificiale è la scienza che mira a rendere ogni cosa smart, il machine learning è una delle tecniche impiegate per sviluppare l’I.A. A sottolinearne la netta distinzione è Google, in occasione dell’evento The Magic in the Machine andato in scena nella sede milanese del gruppo.
L’intelligenza artificiale non è cosa nuova: i primi esperimenti sul tema sono stati condotti fin dagli anni ’50 del secolo scorso, mentre per il machine learning è diverso. Lo ha spiegato Anna Ukhlanova, Research Manager del Google Research Europe di Zurigo. Ciò che fa il M.L. è creare dei pattern partendo da un database di esempi e informazioni. È un modo diverso per programmare un computer, che si discosta dalle dinamiche dei più tradizionali cicli “if then else” e simili.
Un esempio perfetto è rappresentato dall’evoluzione dei filtri antispam: i primi si basavano sull’individuazione di specifici termini nel titolo, nel mittente o nel corpo delle email, facendo ricorso proprio a un funzionamento di questo tipo (se viene individuata la parola *** allora il messaggio dev’essere eliminato), mentre quelli più recenti ed efficaci sono in grado di analizzare il contenuto nella sua complessità, il contesto, la presenza di allegati e molto altro ancora, dunque non limitandosi a rispondere ad un solo criterio di giudizio. Ancora più importante, questi sistemi imparano con la pratica, apprendono attraverso quella che può essere definita un’esperienza formativa, tenendo in considerazione anche gli errori commessi in modo da non ripeterli.
Le reti neurali, invece, possono essere paragonate a una sorta di struttura che emula il funzionamento del cervello umano, una serie di layer che filtrano ed elaborano le informazioni. Ogni neurone compie un’analisi specifica, raccogliendo un quesito in input e arrivando a fornire una risposta in output.
Facendo riferimento a quanto offerto da bigG, questo tipo di tecnologie è applicato a servizi come il Traduttore, il riconoscimento vocale, Google Foto, la casella di posta Inbox, l’altoparlante Home, l’acquisizione delle immagini da parte degli smartphone Pixel e ovviamente il motore di ricerca. Il gruppo ha inoltre lanciato nel 2015 il progetto TensorFlow, una piattaforma aperta per il machine learning e il calcolo distribuito, accessibile da programmatori, sviluppatori e ricercatori di tutto il mondo, con algoritmi, API e tool da sfruttare liberamente. Ne sono nate iniziative come quella finalizzata alla scansione delle immagini marine per la salvaguardia di una specie a rischio di estinzione, i dugongo, giusto per fare un esempio.
The Magic in the Machine
Può sembrare quasi paradossale, ma il machine learning arriva a esprimere appieno le proprie potenzialità nel momento esatto in cui diventa invisibile, quando agisce in background senza svelare tutta la complessità dei propri algoritmi all’utente finale. Si pensi a una tecnologia come quella offerta dall’Assistente Google: un’entità intangibile pensata per fornire informazioni ancor prima che sia l’utente a chiederle, basandosi sulle sue abitudini, sui gusti personali e su elaborazioni che tentano di capire cosa potrebbe essere importante o interessante.
Un assistente virtuale profondamente integrato in smartphone, tablet, set-top box, smartwatch, computer desktop e laptop, altoparlanti da posizionare in casa, che interpreta i comandi vocali anche se le richieste sono poste con un linguaggio naturale e senza seguire una sintassi specifica.
Dal palco dell’evento, Behshad Behzadi (Distinguished Engineer di Google Assistant) ha sottolineato come nel 2015 sia avvenuto il sorpasso del volume di ricerche effettuate in mobilità su quelle inoltrate da piattaforme desktop. Una tendenza che non si fermerà: si stima che nel 2020 oltre cinque miliardi di persone saranno connesse da mobile. Già oggi ognuno di noi dispone in media di tre dispositivi costantemente collegati alla grande Rete.
È dunque facile comprendere perché bigG abbia lavorato sodo per migliorare il sistema di riconoscimento vocale offerto, così da offrire un’esperienza hands free ai propri utenti. Come afferma Behzadi, “Il machine learning è conversazione", è il futuro della ricerca. Il margine di miglioramento non manca: si parla di un tasso d’errore pari all’8% circa nella corretta interpretazione dei termini pronunciati, dovuto alle cause più differenti, ad esempio un forte rumore di fondo.
Il machine learning è conversazione.
Ciò che fa un assistente virtuale è tenere in considerazione il contesto (il luogo in cui ci si trova, le domande poste in precedenza, gli appuntamenti inseriti nel calendario ecc.) in modo da fornire le informazioni corrette al momento giusto, quando possibile persino anticipando le richieste dell’utenza. Per fare questo, va a interagire con diversi sistemi di machine learning: quello per il riconoscimento vocale interpretando il parlato, quello per l’analisi delle immagini cercando uno specifico soggetto nell’archivio fotografico e così via. Si è appena iniziato a scalfire la superficie di un’era fino a poco tempo fa prerogativa esclusiva di romanzi e pellicole sci-fi, oggi realtà concreta (pur con qualche innegabile limite), che arriverà presto a esprimere tutto il proprio potenziale. Perché, come afferma Google, il machine learning cambierà il mondo.