Ci sono cose che possono essere definite in vari modi: pensiamo, ad esempio, a “penna” e “biro” oppure “matita” e “lapis”. Alle volte è una caratteristica della lingua di riferimento, altre volte dipende da tendenze o sfumature culturali, o semplicemente da dove ci troviamo mentre effettuiamo una ricerca.
Un esempio particolarmente significativo è rappresentato dalla sigla COVID-19. Sin dall’inizio della pandemia, le persone in tutto il mondo hanno cominciato a ricercare informazioni sempre più specifiche sui virus. In Google è stato dunque fondamentale imparare a identificare tutte le diverse frasi usate per riferirsi al nuovo coronavirus, per essere sicuri che il motore di ricerca facesse emergere il più ampio numero di informazioni tempestive e di qualità, messe a disposizione da autorità sanitarie affidabili come l'Organizzazione Mondiale della Sanità (OMS) e i Centri per il controllo e la prevenzione delle malattie.
A distanza di un anno, alla sfida sulle terminologie più diffuse, si è affiancata quella sui nomi dei vari vaccini, ma questa volta a Mountain View hanno messo a punto un nuovo, potente strumento: la tecnologia Multitask Unified Model (MUM).
AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e altri vaccini distribuiti su larga scala hanno ciascuno dei nomi diversi in varie parti del mondo: oltre 800, stando all’analisi di Google. Le persone che cercano informazioni sui vaccini possono digitare "Coronavaccin Pfizer," "mRNA-1273," "CoVaccine" - e la lista continua.
MUM, dunque, è in grado di fare in pochi secondi un lavoro che avrebbe richiesto diverse settimane, grazie alle sue capacità di trasferimento di conoscenza; può imparare e trasferire i dati attraverso le oltre 75 lingue su cui è stato testato e non deve imparare una nuova funzionalità per ogni lingua, ma può trasferire ciò che apprende tra di loro, aiutando così da trasmettere rapidamente i miglioramenti ottenuti, anche alle lingue meno testate di altre. Questo è in parte merito dell'efficienza del campione di MUM che richiede molti meno input di dati rispetto ai modelli precedenti per realizzare lo stesso compito. Nel caso dei vaccini, con un solo piccolo campione di nomi ufficiali, MUM è stato in grado di identificare rapidamente queste variazioni tra le lingue.
«Questa prima implementazione di MUM ci ha aiutato a fornire alle persone informazioni fondamentali in modo tempestivo, ovunque si trovassero, e siamo impazienti di scoprire i molti modi in cui MUM può rendere la Ricerca ancora più utile per le persone in futuro”, dichiarano da Google. E continuano: “I nostri primi test indicano che non solo MUM sarà in grado di migliorare molti aspetti dei nostri attuali sistemi, ma ci aiuterà anche a creare modi completamente nuovi di cercare ed esplorare le informazioni».