Un pareggio perfetto: tra il presidente Barack Obama e il suo sfidante Mitt Romney è ormai impossibile individuare un possibile vantaggio. Situazione abbastanza rara nelle elezioni americane, che sta mandando in fibrillazione i sondaggisti e tutti coloro che cercano, con i più svariati metodi, di predire l’esito del voto in novembre. Ma un articolo sul NIT di Seth Stephens-Davidowitz apre alla sfera di cristallo dell’era di Internet: Google. Le richieste del motore di ricerca ed i trend in tempo reale degli internauti, infatti, sono necessariamente più autentici, mentre nei sondaggi le persone mentono molto spesso per vari motivi, attitudini o semplici distorsioni dello strumento sondaggistico.
Il grande esperto di politica ed economia, professore ad Harvard, ha così analizzato a fondo il rapporto fra le query sul motore di ricerca e i temi portanti della campagna elettorale. Con buona sintesi giornalistica, Gawker ha scritto: «Paul Ryan (il vice presidente repubblicano, nda) a petto nudo è citato 9 volte più del Paul Ryan che parla di economia». Un problema o un fattore indicativo di popolarità?
Difficile rispondere, ma chi, per lavoro, è abituato a maneggiare dati aggregati provenienti da milioni di ricerche su Google in centinaia di mercati caratterizzati dai media, è convinto che mettendo a confronto i rate di ricerca di informazioni attinenti al voto con quelli analoghi in elezioni precedenti, si sarebbe in grado di ottenere una buona idea della composizione dell’elettorato 2012, risolvendo uno degli enigmi principali delle elezioni a stelle e strisce. Infatti, il voto negli Usa è legato a fattori come l’iscrizione, il comportamento di gruppi etnici (gli afro, gli ispanici) e a una fortissima astensione. Quindi per stabilire chi vincerà le elezioni spesso è sufficiente stabilire quante persone dei rispettivi bacini elettorali i due candidati riusciranno a convincere a recarsi alle urne. Più determinante dei programmi elettorali o della popolarità dei candidati in sé.
Con un valore statistico in più: gli analisti sottovalutano le query su Google perché hanno un carattere ambiguo, difficile da trattare scientificamente, ma le persone hanno comportamenti molto più naturali in Rete che non quando rispondono al telefono. Quindi, tra pensiero superficiale e quello artefatto, secondo il NYT è meglio il primo.
Ogni mese circa 5000 persone cercano immagini di Ryan a petto nudo. Non chiedetemi perché, ma “Paul Ryan shirtless” su Google è più frequente negli stati democratici che in quelli repubblicani. Nella ricerca di “Michelle Obama” esce tre volte più spesso il termine “brutta” rispetto a “bella” anche in questo caso negli stati democratici […] Gli individui possono ingannare sistematicamente i sondaggisti per quanto riguarda le loro intenzioni, ma gli elettori reali sono quelli che probabilmente cliccano su Google frasi del genere “come votare” o “dove votare” prima delle elezioni. In questo caso, considerando la frequenza di ricerche sul voto, e confrontando il numero di quelli stessi giorni quattro anni prima, il risultato predice molto fortemente l’affluenza, che secondo questi dati sarà uguale o leggermente inferiore.
Ironia verso gli avversari, richieste sulla modalità del voto incrociate con l’origine etnica dell’elettorato – nel 2008 fu determinante il ritorno al voto dell’1% in più degli afroamericani, che dai tempi di Clinton non avevano più trovato un candidato di loro gradimento – sembrano quindi fornire tendenze interessanti in un paese dove i media non sanno più cosa utilizzare per predire il voto. Stando a questo metodo, Google predice che nel 2012 il voto determinante sarà quello ispanico.
Sarà solo un caso che quella è anche l’origine del candidato repubblicano?