Sono molte le ricette al mondo protette da rigorosi segreti industriali, tesi a rendere unico e riconoscibile il gusto di una bibita, di un panino o di una porzione di pollo fritto. La filosofia cambia di poco se dal gustoso panorama dei cibi ci si sposta nell’asettico e tecnologico mondo dell’informatica. Carpire i segreti dei grandi colossi dell’era digitale non è certo semplice, specie se si basano su un numero considerevole di variabili. In questo senso, l’algoritmo del motore di ricerca Google sembra essere uno dei segreti industriali meglio custoditi del Pianeta. Eppure, talvolta, qualche dettaglio emerge ugualmente.
Nel corso di una conferenza, infatti, uno dei principali responsabili del settore ricerche di Google, Udi Manber, ha rivelato qualche dettaglio sul motore di ricerca che, più di tutti, fa muovere il Web ormai da numerosi anni. Interessati a implementare costantemente i loro sistemi, gli sviluppatori di Mountain View lavorano con un unico ideale in mente, ben riassunto da Manber: «Idealmente, ci piacerebbe capire le vostre domande, comprendere tutta la conoscenza e poi unire le due cose». Naturalmente, l’ambizioso obiettivo prospettato da Manber non è ancora raggiungibile con gli attuali sistemi, quindi Google deve per forza analizzare e catalogare il maggior numero possibile di contenuti sul Web, trasformare una semplice chiave di ricerca in un’area semantica su cui lavorare e infine fornire un elenco di risultati, il più pertinenti possibile, all’utente.
Ciò che anni di utilizzo hanno reso una procedura ormai scontata per gli internauti è in realtà un processo estremamente complesso, che prevede un alto numero di variabili per essere realizzato correttamente. In ogni istante del giorno, Google fornisce a decine di milioni di utenti le risposte alle loro domande utilizzando quasi tutte le lingue del mondo, calibrando i risultati su ogni singolo utente in pochi centesimi di secondo. Processi che richiedono, e richiederanno, ingenti risorse fino a quando i computer non inizieranno a simulare il pensiero umano, ha confidato Manber: «Il ventesimo secolo era orientato a dominare la natura. Il ventunesimo secolo sarà orientato a capire le persone. I più grandi centri al mondo di calcolo informatico forniscono ricerche per il Web, email e social network» e proprio dall’analisi dell’enorme mole di dati di questi centri potrebbe partire la comprensione dei meccanismi che sottendono al pensiero umano.
Nel corso della conferenza, Manber ha poi rivelato alcuni dettagli sul funzionamento del motore di ricerca più utilizzato al mondo. Per fornire i risultati agli utenti, Google utilizza più di 100 variabili allo scopo di dare un peso ad ogni singola pagina del Web. Tali variabili comprendono la lingua, la collocazione fisica e geografica, le preferenze dimostrate dagli utenti nelle fasi di ricerca e altri numerosi piccoli dettagli che contribuiscono al funzionamento dell’algoritmo di ricerca. Un team di una dozzina di sviluppatori monitora continuamente la qualità dei risultati offerti da Google, analizzando ogni giorno centinaia di grafici e creando report utili agli ingegneri per modificare le variabili attraverso cui funziona Google.
Le modifiche proposte dagli ingegneri vengono attentamente analizzate prima di essere introdotte nel sistema. La fase di sperimentazione dura generalmente numerosi giorni e viene compiuta su un cluster di server dedicati unicamente a questo scopo: «Il mio gruppo di ricerca di Google ha a disposizione numerose migliaia di macchine, con capacità di storage misurato in petabyte. Queste unità sono per il nostro uso esclusivo e non vengono utilizzate per fornire i risultati delle vostre ricerche» ha confermato Manber.
Per mantenere alta la qualità dei suoi risultati, Google aggiorna continuamente il suo algoritmo anche con più di una correzione al giorno. Stando alle cifre comunicate durante la conferenza, nel corso del 2007 Mountain View avrebbe apportato ben 450 modifiche al suo algoritmo. Questi continui aggiornamenti non solo consentono di ottenere risposte particolarmente pertinenti alle proprie query, ma permettono anche una migliore funzionalità della ricerca semplice di Google, quella maggiormente utilizzata dagli utenti. Le opzioni avanzate sono utilizzate, in proporzione, molto poco e Mountain View non fa nulla per incentivarne l’utilizzo. L’obiettivo, infatti, è quello di rendere il servizio di ricerca più affidabile dal lato di Google e non da quello degli utenti, che devono poter contare su un sistema rapido, efficace e intuitivo.
Google continua dunque nella sua politica di maggiore apertura verso i segreti del suo algoritmo. Ma l’impressione è che le informazioni fornite da Manber costituiscano solamente la punta di un iceberg particolarmente grande e ancora molto misterioso.