IA multimodale: la nuova sfida di Google

0
543
IA multimodale

Google intende migliorare l’esperienza di ricerca in Internet utilizzando l’IA multimodale.

Cos’è l’IA multimodale?

L’IA multimodale fa riferimento al modo di comunicare, appunto multimodale, che è proprio del cinema e della televisione. Tv e cinema comunicano attraverso il suono, le immagini e alcune volte i testi. Questo fa di entrambi i media due sistemi di comunicazione multimodali, differenti dalla radio, che comunica solamente attraverso il suono (monomodale). Google sta lavorando ad approcci che coinvolgono l’intelligenza artificiale e la spingono verso un tipo di approccio multimodale. L’azienda sta sviluppando un algoritmo di studio chiamato Multitask Unified Model (MUM), che migliorerà le esperienze di ricerca su Internet. A partire dall’inizio del prossimo anno, la IA in via di sviluppo sarà in grado di riconoscere le immagini e favorire ricerche più intuitive. Niente più digitazione, dunque. Il MUM di Google comprenderà le immagini e le userà per dare il via alla ricerca.

IA multimodale: il MUM usa le immagini

Google ha pensato di inserire MUM nella ricerca di Lens. Con questa mossa potremo inserire una foto, ad esempio quella di un indumento con un motivo grafico particolare, e usarla per trovare lo stesso motivo grafico. Se avessi bisogno di una camicia a righe e di un paio di calzini con lo stesso motivo, mi basterà dunque inserire il motivo della camicia e l’IA multimodale comincerà una ricerca correlata. Questo eviterà che l’utente, durante la digitazione, si sprema le meningi nel tentativo di trovare la giusta terminologia. Ugual cosa per i video. MUM riconoscerà, all’interno del video, quello che noi stiamo cercando e ce lo schiafferà sotto il naso.

Google Lens

A veicolare questa novità ci penserà Google Lens, l’app mobile di riconoscimento delle immagini. Presto Google aggiungerà un nuovo pulsante che permetterà agli utenti di cercare le immagini presenti su una pagina tramite l’app mobile. L’IA multimodale ci aiuterà anche nell’utilizzo di Google Search. In che modo? Riassumerà le informazioni principali.

LEAVE A REPLY

Please enter your comment!
Please enter your name here