Il cervello di Google

15 Mag, 2012 Fonte: MAURIZIO BONO - la Repubblica - Editore

«Da ragazzo, in India, alla fine degli anni Settanta, ho visto Star Trek e ho cominciato a sognare di avere un computer così, uno che avesse la risposta a tutto perché sapeva ogni cosa».
Più avanti, laureato in ingegneria informatica a Rorkee, diplomi superiori in ricerca dei dati all’Università di Minnesota Duluth, e alla Cornell di Ithaca, New York, Amit Singhal, oggi il numero uno del team che elabora, applica e costantemente sviluppa gli algoritmi di Google, non ha mai tolto gli occhi dalla meta.
Così, adesso che il motore di ricerca più usato e famoso del mondo ha annunciato di essere pronto a considerarsi una intelligenza artificiale, tocca a lui spiegare come fanno e come intendono proseguire a fare, col ritmo esponenziale di progresso tecnico a cui l’azienda di Mountain View ha legato la sua leggenda, a insegnare a un computer che nel mondo non ci sono solo numeri, stringhe e parole, ma “cose”. E che noi umani le parole e i numeri le adoperiamo proprio per indicarle: «Per il nostro cervello è facile e naturale, ma per un’insieme di link, processori e programmi richiede un salto di qualità straordinario. Corrispondente al passaggio prima dai dati all’informazione, poi dall’informazione alla conoscenza».
“Google knowledge graph”, diagramma della conoscenza, si chiama infatti il progetto che Singhal dirige e che, gettata la bomba qualche settimana fa, ora illustra in teleconferenza da Londra a un pubblico ristretto di nove interlocutori in Europa – giornalisti, analisti delle nuove tecnologie e osservatori interessati soprattutto al suo effetto sulla nostra vita – mentre in perfetto stile informale Google mescola un caffè nel bicchiere di carta preso all’angolo beveraggi della sede londinese: «Prendetevene uno, se vi va: da qualche parte, lì nelle altre nostre sedi all’estero dove siete ospiti, c’è di sicuro». In maglioncino azzurro e jeans, il capoprogetto dell’impresa “Star Trek” sorride entusiasta: «Sembra ieri che i computer proprio non riuscivano a capirci, perché non sapevano di che cosa stessimo parlando. Gli dicevi “apple” e non avevano la più pallida idea se stessi cercando una mela da mangiare o un’azienda globale. Solo perché la parola era la stessa, e per il computer esisteva solo la parola. Peggio ancora, all’inizio l’unica via per rispondere che aveva era rintracciare ogni documento che la contenesse».
Poi – è storia – è nato l’algoritmo “Page Rank” (dal nome di Larry Page, fondatore di Google con Sergey Brin), e a mettere in ordine le scartoffie digitali è entrato in campo il concetto di “rilevanza”. Ma aveva ancora a che fare con la frequenza d’uso e l’associazione con altre parole chiave. Non bastava, per dire, a distinguere “Apple” da “apple”, ma solo a stabilire che era più frequente che un informatico o un investitore cercassero Steve Jobs che l’ortolano dietro l’angolo. E ci volevano tempo e successive richieste, per arrivarci, per non parlare di chi fosse interessato alla mela di Eva nella Bibbia o alla Big Apple intesa come New York.
I miglioramenti dell’algoritmo, a Google hanno nomi simpatici per minimizzare la complicazione sottostante: Fritz, nel 2003, aggiornava costantemente l’indice e non più a periodicità fissa, Panda e Penguin sono i più recenti (2011) che hanno insegnato ad attribuire più qualità a chi ha scritto per la prima volta una notizia rispetto a tutti i “mi piace” che ha innescato sui social network. Ma la svolta vera, secondo Singhal è stata Universal search. Provare per credere: scrivi “tour Eiffel” e in cima alla lista arrivano subito siti che parlano di città e monumenti, scrivi Scarlett Johansson e sono siti di cinema, scrivi Obama e arrivano le news. Sembra niente perché ci siamo già dimenticati che non è sempre stato così, ma anche perché, avendo la sorte di non essere computer, non apprezziamo appieno lo sforzo fatto dagli amici di silicio: adesso loro ci arrivano subito, e non per tentativi, perché hanno “capito” che qua fuori c’è un mondo: «Siamo partiti sperimentalmente con 12 milioni di “entità ” identificate dal programma di conoscenza Freebase. Oggi siamo a 200milioni di “entità “, cioè “cose” che il programma di ricerca conosce con le loro interconnessioni e i loro caratteristici attributi. Ed è un miracolo che facciamo in tutte le lingue, dall’inglese al giapponese all’arabo al cinese, un’apparente complicazione che in realtà ci ha aiutato ad arrivare al nocciolo del problema separando le “parole” e le “cose”». Suggerisce una prova semplice, digitare “Monet”: appare il campo “ricerche su Monet nell’arte”, e la foto dei cinque o sei capolavori più noti del pittore. Il sistema di ricerca sta imparando che Monet è un pittore, e che quello che più conta di un pittore sono le sue opere.
Come un padre orgoglioso, sottolinea la precocità del ragazzo: «Sono i primi passi, in realtà abbiamo cominciato a costruire una specie di acceleratore di particelle, che elementi subatomici ne verranno fuori possiamo appena ipotizzarlo». Se la più prevista delle particelle è il “senso” delle cose, il suo gemello è tuttavia l’originalità del contenuto prodotto dalla macchina intelligente. Poniamo che domani alla domanda secca digitata nel campo della ricerca risponda una asserzione così esatta o completa da poter essere paragonata a quella di un esperto della materia: a quel punto, dottor Singhal, non sarebbe giusto riconoscere al programma un “diritto d’autore”? L’ingegnere frena: «È un po’ presto per ipotizzarlo, il nostro scopo resta reperire dati, connessioni, inferenze e quindi risposte ragionevolmente sicure e attestate, suscitate dalla curiosità di chi pone la domanda. Ma certamente il progresso in questa direzione ci avvicinerà a una qualità di conoscenza paragonabile a quella che lei definisce d’autore. Anche se non credo sia una prospettiva dietro l’angolo».
La domanda era in effetti suggerita da una coincidenza: Google ha appena pubblicato una relazione giuridica commissionata a uno dei più autorevoli esperti americani sul “primo emendamento”, quello che garantisce la libertà di espressione e d’opinione a giornali, scrittori, pensatori in genere, e in essa Eugene Volokh suggerisce che lo stesso diritto andrebbe riconosciuto in blocco a Google. L’implicazione più diretta è che se così fosse non si potrebbe contestare all’azienda una posizione monopolista, come minaccia di fare un’istruttoria della Federal Trade commission, e per questo farà discutere a lungo. Ma non sarebbe la prima volta che da un acceleratore viene fuori un neutrino che pare più veloce della luce.