Mentre Microsoft e Google si scontrano per stabilire quale chatbot AI sia migliore, questo non è l’unico utilizzo dell’apprendimento automatico e dei modelli linguistici. Oltre al progetto, di cui si vocifera, di mostrare più di 20 prodotti basati sull’intelligenza artificiale durante l’evento annuale I/O di quest’anno, Google sta facendo progressi verso l’obiettivo di costruire un modello linguistico di intelligenza artificiale che supporti 1.000 lingue diverse. In un aggiornamento pubblicato lunedì, Google ha condiviso ulteriori informazioni sull’Universal Speech Model (USM), un sistema che Google descrive come un “primo passo critico” nella realizzazione dei suoi obiettivi.
L’AI di Google
Lo scorso novembre, l’azienda ha annunciato l’intenzione di creare un modello linguistico in grado di supportare 1.000 delle lingue più parlate al mondo, rivelando al contempo il modello USM. Google descrive USM come “una famiglia di modelli vocali all’avanguardia” con 2 miliardi di parametri addestrati su 12 milioni di ore di parlato e 28 miliardi di frasi in oltre 300 lingue.
USM, che YouTube utilizza già per generare didascalie chiuse, supporta anche il riconoscimento vocale automatico (ASR). Questo rileva e traduce automaticamente le lingue, tra cui inglese, mandarino, amarico, cebuano, assamese e altre ancora. Al momento, Google afferma che USM supporta oltre 100 lingue e servirà come “base” per costruire un sistema ancora più esteso. Meta sta lavorando a uno strumento di traduzione AI simile, ancora in fase iniziale. Per saperne di più sull’USM e sul suo funzionamento, si può leggere il documento di ricerca pubblicato da Google qui. Una destinazione per la tecnologia potrebbe essere quella degli occhiali a realtà aumentata, come quelli mostrati da Google durante l’evento I/O dello scorso anno, in grado di rilevare e fornire traduzioni in tempo reale che appaiono proprio davanti agli occhi. Questa tecnologia, tuttavia, sembra ancora un po’ lontana e l’errata rappresentazione della lingua araba da parte di Google durante l’evento I/O dimostra quanto possa essere facile sbagliare.