Google è il numero uno della ricerca in rete in gran parte grazie al modo in cui organizza l’informazione. Il cosiddetto PageRank, cioè il sistema parzialmente segreto con il quale ordina e quindi cerca le informazioni testuali nelle pagine, è infatti alla base dell’efficacia del motore. Ora sembra che l’obiettivo a Mountain View sia nel trasferire il suddetto sistema anche alle immagini.
Si dovrebbe chiamare VisualRank e al momento è solo un progetto illustrato in un paper presentato all’International World Wide Web Conference di Pechino. Ad illustrarne il funzionamento sono stati due ricercatori di Mountain View, i quali hanno spiegato come il sistema punti a fondere le tecnologie di image recognition con quelle di valutazione dell’importanza dei collegamenti.
Fino ad ora infatti la ricerca per immagini, su Google come su altri motori di ricerca, funziona testualmente. Il paradosso infatti è dovuto al fatto che non potendo i computer riconoscere le immagini ci si basa sul testo contenuto nei pressi dell’immagine, di quello contenuto nell’URL, nel nome del file e infine sui metadati, cioè le informazioni addizionali che possono essere abbinate ad un’immagine. Proprio per raffinare tale sistema di ricerca Google tempo fa aveva dato il via all’Image Labeler Game.
I sistemi di riconoscimento degli elementi presenti nelle foto sono infatti ancora tecnologie primordiali evolutesi solo dal punto di vista della face-recognition per ovvi motivi di sfruttamento commerciale. Ora il progetto denominato PageRank for Product Image Search punta a dare una valenza commerciale anche alla ricerca di oggetti nelle foto, cercando di individuare per primi i prodotti più cercati.
Indicizzare e categorizzare tutte le immagini di internet come si fa con le pagine o come fa (testualmente) al momento Google Images è infatti un’impresa inaffrontabile e per il primo esperimento a Google hanno preso in considerazione 2000 immagini dei principali prodotti cercati in rete. L’ambito è stato poi ristretto alle 10 immagini più rilevanti calcolate sia con il nuovo sistema che con quello di Google Image Search. Il risultato è stato che il nuovo sistema ha dato l’83% in meno di immagini non rilevanti: un primo importante passo verso un sistema di ricerca evoluto e dissociato dall’ordine esclusivamente testuale che ha guidato i motori di ricerca fino ad oggi.