Google sta per entrare nel futuro. Lo dice il responsabile Amit Singhal e lo dice al Wall Street Journal, il che vale come una presentazione ufficiale utile a gettar luce su quanto sta per accadere. E quel che sta per accadere è una sorta di rivoluzione: la semantica entrerà prepotentemente nell’intelligenza del motore di ricerca, rendendo così più “umana” la lettura delle query per rendere così più efficace il tenore delle risposte.
Singhal non mette a disposizione deadline precise, ma la conversione sarebbe ormai imminente. E la finalità chiara: Google non intende più fornire soltanto link presso cui trovare le risposte, ma intende fornire piuttosto le risposte di per se stesse. Tra oggetto della domanda e oggetto della risposta non debbono più esserci altri intermediari e le SERP non saranno più pertanto una collezione di contesti entro cui andare a trovare l’informazione cercata, ma in molti casi l’informazione stessa emergerà già dalla pagina di Google senza passi ulteriori.
Ed anche James Whittaker vedrà confermate le proprie accuse: sì, il tutto anche per motivi di advertising. Ma non solo.
Quel che Google andrà a fare è un affiancamento tra le vecchie risposte e le nuove. Sulla pagina compariranno quindi i canonici link, ma saranno preceduti da quelli che Google ritiene poter essere percorsi migliori verso le risposte auspicate. Il tutto funzionerà sulla base di entità, ossia persone, oggetti o altre unità ben definite su cui il motore va a costruire la propria consapevolezza del mondo. Cercando quindi un film sarà più facile reperire ad esempio la lista degli attori o le sale di proiezione poiché le varie entità risultano semanticamente ricollegabili. La comprensione va però anche oltre la semplice formalità: chiedendo al motore quali sono i fiumi più lunghi d’Europa, l’algoritmo dovrebbe essere in grado di capire e formulare una risposta compiuta (facendo pertanto un passo verso quanto ha introdotto nel recente passato già un progetto quale Wolfram Alpha).
Inizia tutto con l’acquisizione della Metaweb Technologies, un gruppo che ai tempi si presentava così alle porte del Googleplex con in dote 12 milioni di “entità”:
Nel tempo abbiamo tentato di migliorare la ricerca approfondendo la nostra conoscenza delle query e delle pagine web. Il web non è solamente composto da parole – è informazione circa le cose del mondo reale, e capire le relazioni tra le entità del mondo reale può aiutare a disporre di rilevanti informazioni più rapidamente
Oggi le entità gestite sono circa 200 milioni, frutto dell’arricchimento del database iniziale grazie agli algoritmi utilizzati nell’arco di 2 anni di lavoro da parte di un team di circa 50 ingegneri.
Per Google trattasi di un passo di duplice valore. Da una parte, infatti, v’è una fondamentale valenza tecnologica rappresentata dal passo in avanti che il gruppo compie distanziando da sé sia Facebook (un gruppo che per definizione è un collettore di identità, pur non gestendole ad oggi oltre la sola valenza “social”) che Bing (un motore di ricerca di impronta ancora tradizionale, nel solco del vecchio Google e delle SERP basate sui link). Dall’altra v’è inoltre una valenza commerciale, poiché un’organizzazione differente degli spazi potrebbe offrire nuove opportunità in termini di advertising.
Nel momento in cui il nuovo Google “semantico” troverà la via del Web, l’impatto verrà registrato su circa il 10-20% delle query (decine di miliardi di richieste al mese). In prospettiva la pervasività del nuovo impianto sarà però sempre più incisiva: il Web semantico è una promessa che Google intende iniziare ad approcciare in modo sempre più concreto.