Ricercatori Microsoft hanno scoperto che i dati raccolti nei log durante la navigazione Web (indirizzo IP, cookie, sistema operativo, tipo del browser e stringa user-agent) possono rappresentare di per sé stessi una minaccia per la privacy, in quanto consentono in buona misura di identificare le attività dei singoli computer.
I ricercatori hanno verificato che, nel 62% delle volte, è sufficiente utilizzare solo l’informazione contenuta nella stringa HTTP user-agent per individuare con precisione una macchina host. Combinando questi dati con l’indirizzo IP, la percentuale aumenta fino all’80,6%, mentre con il solo prefisso IP la precisione è del 79,3%. Se più persone utilizzano lo stesso host, come accade in una famiglia, il valore sale addirittura al 92,8%.
Questo risultato è stato ottenuto analizzando i dati anonimi inviati in un mese dagli utenti di Hotmail e Bing. Le informazioni raccolte derivano dagli eventi “application-layer” diretti verso i server all’interno delle reti Bing e Hotmail. Hotmail ha permesso di scoprire il sistema operativo utilizzato, il tipo di browser, l’indirizzo IP di origine, l’ora del login e l’user ID, mentre da Bing sono stati raccolti le stringhe HTTP user-agent, l’indirizzo IP da cui è partita la query sul motore di ricerca, l’ID e la data di creazione dei cookie.
Secondo i ricercatori, anche attivando la navigazione anonima gli utenti possono essere identificati. Per mantenere l’anonimato, consigliano invece di utilizzare un server proxy, un software come Tor o un browser che possiede una stringa user-agent popolare, in modo tale da rendere più difficile l’individuazione di una particolare macchina host.