Paradossi della Rete: Google, il più popolare motore di ricerca, con un indice di oltre 2 miliardi di pagine, ha deciso di impedire l’indicizzazione del proprio sito da parte degli altri motori di ricerca. Lo riporta Newsbytes.com.
Nel file robots.txt (il file che regola il comportamento degli spider quando rovistano in un sito) Google ha inserito una stringa che impedisce ai robot di indicizzare 19 aree del sito, tra cui l’archivio Usenet, l’indice delle immagini, il catalogo di vendite per corrispondenza e la nuova sezione news.
«Abbiamo impedito agli altri spider di rovistare in tutto il sito perché questo assorbirebbe troppe risorse dei nostri server,» ha dichiarato il portavoce di Google Nate Tyler, aggiugnendo che Google tiene particolarmente conto di questo aspetto quando indicizza i siti. Ma, secondo il direttore di SearchEngineWatch.com Danny Sullivan, Google potrebbe voler impedire ai concorrenti di saccheggiare il suo archivio Usenet e gli altri contenuti proprietari.