Il chip analogico di IBM conquisterà il mondo dell’intelligenza artificiale?

0
423

Un team di IBM Research ha sviluppato un chip analogico a segnale misto adatto ai carichi di lavoro dell’IA. Il progetto è ancora in fase di ricerca, ma promette bene. Mentre l’IA generativa attualmente consuma enormi quantità di hardware e di energia, sembra che stia emergendo un’alternativa, ma nessuno sa quando sarà pronta per la prima serata.

Il concetto di “calcolo analogico in memoria” funziona in parte come il cervello biologico. La comunicazione tra i nostri neuroni è regolata dalla forza di ogni sinapsi, che si regola dinamicamente ed è praticamente impossibile da catturare in segnali digitali. Il chip IBM funziona fondamentalmente in questo modo: la memoria a cambiamento di fase (PCM) costituisce la base a livello di hardware, come controparte dei nostri blocchi biologici. Con questa tecnologia è possibile eseguire in modo molto più efficiente i calcoli dell’intelligenza artificiale, in particolare le operazioni di moltiplicazione-accumulazione (MAC-ops).

Preciso ed efficiente


Per ottenere questo risultato, i ricercatori IBM hanno dovuto raggiungere un’accuratezza simile a quella che vediamo nei chip digitali più avanzati, cioè con 14 nanometri come dimensione minima. Secondo IBM, il chip analogico è particolarmente promettente perché sarebbe molto più efficiente dal punto di vista energetico rispetto, ad esempio, alle GPU per i carichi di lavoro dell’intelligenza artificiale. Inoltre, aggira alcuni dei soliti colli di bottiglia affrontati dai chip classici. Per esempio, All About Circuits cita i limiti dell’architettura Von Neumann, che rallenta i calcoli a causa della latenza tra il processore e la memoria (compresa la cache che si trova sul chip).

Almeno da questo punto di vista, c’è molto da guadagnare: anche le ultimissime GPU di Nvidia in grado di gestire l’intelligenza artificiale consumano molto e comportano costi che fanno passare notti insonni anche alle grandi aziende tecnologiche. I modelli linguistici di grandi dimensioni altamente complessi come il GPT-4 richiedono un’infrastruttura hardware che viene costantemente messa alla prova. Questo rende tali modelli del tutto inadatti all’esecuzione in locale: gli LLM compatti con set di dati di alta qualità sono la strada da percorrere per l’implementazione on-premise.

Analogie con i chip “classici


Sebbene la tecnologia analogica differisca dai chip tradizionali su molti fronti, ci sono anche delle somiglianze. Ad esempio, IBM ha scelto di aggregare 64 “piastrelle” su un chip integrato. Questo ricorda la scalabilità possibile con le attuali architetture dei computer di Intel, Nvidia e AMD, tra gli altri.

Inoltre, per elaborare i calcoli è ancora necessario un passo verso il digitale: ogni tile contiene un convertitore analogico-digitale integrato. Alla fine, però, ciò che conta sono i risultati finali. Questi erano già impressionanti: sul set di dati CIFAR-10, che mette alla prova l’intelligenza artificiale nel distinguere le immagini, il chip ha ottenuto un punteggio del 92,81%. Si tratta di un risultato superiore a qualsiasi altro precedente. Tuttavia, ci vorranno anni prima che un chip del genere possa essere prodotto su larga scala. Come per la tecnologia quantistica, resta da vedere quando sarà possibile.

LEAVE A REPLY

Please enter your comment!
Please enter your name here