31 Marzo 2005: in questa data la società Google risulta aver proposto un brevetto (in attesa di approvazione) dal testo oltremodo interessante in quanto lascia emergere quelle che potrebbero essere le strategie del gruppo in particolare in tema di PageRank ed indicizzazione (duetto che rappresenta il vero cuore del motore di ricerca).
Il testo proposto concerne la classificazione di documenti in base ad una molteplicità di caratteristiche di vario tipo e la cui importanza è soppesata internamente (e in assoluta segretezza) all’algoritmo usato dal motore. Ai dati usati finora da Google, dunque, potrebbero aggiungersene altri in grado di fornire all’indice una maggior qualità grazie ad un tracciamento storico di tutte le attività concernenti i siti indicizzati.
Il brevetto elenca con una certa meccanicità un lungo elenco di ben 63 «metodi», correlati l’uno all’altro con una sorta di struttura ad albero, tali da monitorare l’attività dei siti partendo dagli estremi della registrazione del dominio (o del cambiamento di destinazione), la frequenza della modifica delle pagine, l’entità dei link, la datazione storica di ogni cambiamento apportato ai siti web. È facile supporre come un PageRank basato su tale quantità di fattori aumenti in modo rilevante la qualità dell’indice moltiplicandone i parametri di valutazione e monitoraggio.
Secondo Danny Sullivan (blogger Search Engine Watch) il brevetto conferma inoltre indirettamente l’esistenza della cosiddetta Sandbox, ovvero una sorta di anticamera all’interno della quale Google conserva i siti prima di indicizzarli a dovere: tale espediente affonderebbe le proprie radici nell’esigenza di scoraggiare il cosiddetto Google-bombing, ovvero la pratica di moltiplicare link appositamente costruiti al fine di plasmare a piacimento il PageRank del motore di ricerca.
Tale quadro della situazione lascia dunque immaginare un futuro PageRank al quale andranno a contribuire i dati ottenuti grazie al prossimo servizio di statistica già in cantiere, e lo stesso accreditamento ICANN come Registrar potrebbe non essere un discorso a sé stante rispetto a quanto suggerito dal brevetto del 31 Marzo (in particolare in riferimento agli aspetti legati al monitoraggio dei domini).