Il più famoso motore di ricerca del mondo ha preso… un caffè. È alla bevanda, ma soprattutto alla sua componente eccitante, la caffeina, che a Mountain View hanno pensato per definire il nuovo metodo di indicizzazione di Google. Caffeine è appena stato annunciato sul blog ufficiale e si preannuncia come una piccola ma determinante rivoluzione nel mondo della Big G.
Il sistema garantirebbe contenuti più aggiornati e un maggior numero di risorse Internet indicizzate, secondo un modello, illustrato nella immagine in alto, che supera il multilivello a diverse fasi preferendogli un nuovo schema per il quale i contenuti presenti sul Web vengono suddivisi in porzioni e costantemente visitati, per poi costruire un indice più aggiornato che non soffra delle contraddizioni dettate dagli algoritmi e scongiurando certi piccoli ritardi sull’esito delle ricerche.
Le dichiarazioni di Google sono altisonanti: 50% dei contenuti più aggiornati; possibilità di rilevare post, collegamenti, discussioni anche molto recenti con una velocità prima impossibile. Caffeine cattura 100 milioni di Gigabite e aggiorna centinaia di migliaia di pagine al giorno.
Per intenderci, ci vorrebbero 625.000 iPod della massima capacità per contenere questi dati. Messi uno di fianco all’altro formerebbero una fila di 70 chilometri.
Caffeine, tuttavia, non mette in discussione la missione originaria del motore di ricerca ed è la stessa azienda a spiegare le ragioni del passo:
I contenuti sul Web stanno fiorendo. Tutto cresce non soltanto in dimensione e numero, ma con l’avvento dei video, delle immagini, nelle notizie in tempo reale, il comportamento delle pagine Web è più ricco e più complesso. Le persone hanno delle aspettative sempre più alte nei confronti del motore di ricerca: chi cerca, vuole trovare contenuti i più rilevanti e aggiornati; chi pubblica, si aspetta di trovarli nell’istante stesso in cui ha pubblicato.
Una logica interessante, che in un certo senso prende il via da Google News e trova sponda nell’esplosione della blogosfera, dei contenuti prodotti dagli utenti e dalla loro voglia di informarsi quotidianamente sul Web. Insomma, la rivoluzione è partita più orizzontalmente dal basso, dalle nostre abitudini, che non verticalmente dai progetti di Google.
Da qui la scelta di ibridare due concetti: il corpus di pagine statico, il cui valore è l’estensione e la sua anzianità, insieme al motore di ricerca basato sulle pagine dinamiche, che punta le sue analisi sulle conversazioni attorno ai contenuti registrandone i cambiamenti. Così facendo, il più grande archivio Web esistente sarà d’ora in avanti più “sul pezzo”.
Non a caso Google ha intenzione di fondare su Caffeine (da oggi gira sui suoi server, è già stato trovato uno slogan: “Big, Fresh and Here”) i servizi del futuro.