mercoledì 4 luglio 2007

Il New York Times ha cercato di sapere come funzionano gli algoritmi di Google

Il Googleplex è il quartiere generale di Google, si trova a Mountain View, nella Contea di Santa Clara, in California, nei pressi di San Jose. L'interno dell'edificio è arredato in modo originale con lampade colorate, giganteschi palloni di gomma, divani rossi, all'interno della struttura si trovano anche numerosi servizi e luoghi di ritrovo per i dipendenti come ad esempio ambulatori medici, bar e una sauna. L'edificio principale in precedenza era la sede della Silicon Graphics (SGI).

La struttura non si espande tanto in larghezza ma piuttosto in superficie, copre infatti un'area molto vasta, nel tempo sono stati incorporati anche altri edifici vicini oltre a quello originario.

E' in questo habitat particolare che vengono concepiti i segreti che hanno portato Google ad essere il motore di ricerca più utilizzato al mondo.

Una delle peculiarità più segrete e affascinanti di Google è l'algoritmo di ranking, che regola il posizionamento dei siti web nelle pagine dei risultati delle ricerche.
Il custode di questo algoritmo è il giovane Amit Singhal. Il New York Times è riuscito a mandare un giornalista nel Googleplex per intervistare questo "guru" dell'algoritmo di Google.

"La ricerca negli ultimi anni è passata dal ‘Dammi quello che ho scritto' al ‘Dammi quello che voglio'" spiega Singhal, quarantenne di origine indiana che lavora per Google dal 2000.

Il segreto dell'algoritmo, secondo Singhal, sta nel continuo aggiornamento e aggiustamento da parte di chi lo utilizza. I 10mila impiegati di Google utilizzano un sistema, denominato Buganizer, che aiuta a segnalare segnalare i problemi riscontrati; di media vengono segnalate 100 potenziali migliorie al giorno, che vengono poi vagliate da Singhal.

Una delle questioni nodali riguarda l'interesse dell'utente verso le pagine nuove o verso quelle vecchie. Negli ultimi mesi ci sono stati dei cambiamenti ed è stato formulato un modello matematico, denominato QDF (acronimo di query deserve freshness) per riuscire a determinare in quali casi un utente preferisce qualcosa di nuovo e quando invece qualcosa di vecchio.

Per farlo vengono monitorate tutte le notizie fresche pubblicate sul Web. "Quando c'è un blackout a New York – spiega Singhal – i primi articoli appaiono dopo 15 minuti; ma noi riceviamo le prime interrogazioni dopo due secondi".





Vota o condividi questo articolo





Nessun commento: