Pubsubhubbub non è uno scioglilingua, ma il possibile futuro in real time di Google. Per rendere l’indicizzazione dei contenuti più rapida ed efficiente, la società di Mountain View sta implementando un nuovo sistema per consentire agli editori online, di qualsiasi dimensione, di inviare automaticamente i loro contenuti al motore di ricerca a pochi secondi dalla pubblicazione degli stessi. Il nuovo servizio in fase di sperimentazione trae spunto dal principio di funzionamento dei feed RSS.
Pubsubhubbub (PuSH) è basato sul formato Atom e consente ai produttori dei contenuti di inserire nei loro feed l’indicazione di un particolare Hub, che avrà il compito di segnalare istantaneamente la pubblicazione di un nuovo contenuto online da parte del sito web cui è collegato. Tale soluzione consente agli iscritti di ricevere i nuovi contenuti senza dover ciclicamente controllare la presenza di nuovo materiale pubblicato attraverso il feed. In pratica, non sono più gli iscritti a richiedere al dato editore online gli aggiornamenti, ma è l’editore stesso ad avvisare gli iscritti quando vengono pubblicati nuovi contenuti. Chi produce un nuovo contenuto avvisa l’Hub, che a sua volta si attiva per inviare gli aggiornamenti agli iscritti in pochi secondi dal momento della pubblicazione.
Adottando una simile soluzione, Google potrebbe aumentare considerevolmente le proprie capacità di indicizzazione in tempo reale. Ogni editore dovrebbe infatti indicare il proprio Hub di riferimento come già avviene per i feed RSS, consentendo così al motore di ricerca di ricevere gli avvisi sulla presenza di nuovi contenuti senza dover verificare ciclicamente la presenza degli stessi nei siti web. La fase di crawling potrebbe essere così dedicata alla ricerca degli Hub e dei feed PuSH, ottimizzando le risorse e accorciando i tempi di reazione per l’aggiornamento dei sistemi di indicizzazione.
Secondo gli sviluppatori di Mountain View, Pubsubhubbub potrebbe cambiare sensibilmente l’attuale assetto delle ricerche online e potrebbe modificare l’esperienza d’uso della Rete da parte degli utenti. L’adozione di un sistema in real time richiede però l’implementazione di nuove soluzioni per arginare i fenomeni legati allo spam e per migliorare la qualità dei risultati forniti. Il sistema non potrà semplicemente fornire i link verso i contenuti segnalati da PuSH, ma dovrà anche essere in grado di scremare il rumore di fondo e applicare alcuni filtri per offrire dati pertinenti.
La nuova soluzione messa in campo da Google potrebbe, inoltre, offrire maggiori opportunità per i piccoli editori online, a volte penalizzati dai tempi di indicizzazione del motore di ricerca di Mountain View. In alcuni casi, il processo di scansione e indicizzazione dei contenuti avviene su base settimanale, impedendo così agli autori di mettere da subito in evidenza i propri contenuti nelle pagine dei risultati. PuSH potrebbe consentire ai piccoli editori di avvisare tempestivamente il motore di ricerca, ottenendo maggiore visibilità e offrendo agli utenti un maggior numero di risorse per le loro ricerche in Rete.
Pubsubhubbub è un protocollo aperto, dunque il sistema potrà essere utilizzato anche dai motori di ricerca concorrenti come Bing e Yahoo. «I miei capi mi hanno detto di promuovere apertamente questo approccio senza costrizioni anche ai nostri competitor» ha confermato Brett Slatkin, principale responsabile del nuovo protocollo per la syndication in real time targata Mountain View. La scelta di aprire il formato agli altri motori di ricerca potrebbe consentire al nuovo servizio di diffondersi rapidamente sui siti web, consentendo così a Google di migliorare le proprie soluzioni per l’indicizzazione dei contenuti in tempo reale.
Il nuovo sistema è stato da poco adottato dalla piattaforma WordPress per offrire agli utenti maggiore visibilità per i loro contenuti. WordPress.com ha attivato il supporto per il formato sui propri 10,5 milioni di blog in maniera automatica, senza richiedere alcuna opera di configurazione da parte dei propri iscritti. Gli utenti in possesso di una versione self hosted di WordPress potranno utilizzare il nuovo plugin PuSHPress, già comprensivo di un Hub e dunque più semplice da utilizzare rispetto ad alcune soluzioni già messe a disposizione precedentemente.