Mercoledì Google ha lanciato il suo sforzo più ambizioso per competere nel campo in rapida crescita dell'intelligenza artificiale generativa, lanciando un modello di intelligenza artificiale noto come Gemini, progettato per competere con modelli GPT del calibro di OpenAI e per potenziare tutto, dalle applicazioni consumer di Google agli smartphone Android. - Google lancia Gemini, il suo modello di intelligenza artificiale più avanzato, per fare concorrenza a ChatGPT
La portata delle ambizioni di Google si riflette nell'annuncio dell'azienda, che ha presentato Gemini come il "modello di IA più grande e più capace" dell'azienda e ha dichiarato una "era Gemini" che prevede l'utilizzo del modello del gigante tecnologico in ogni ambiente, dalle grandi aziende ai dispositivi consumer come il Google Pixel 8 Pro.
A differenza dei modelli di intelligenza artificiale esistenti che in genere si occupano di un solo tipo di richiesta da parte dell'utente, ad esempio esclusivamente immagini o testo, Gemini è stato costruito per essere "multimodale", ha dichiarato Google. Ciò significa che accetta input che includono diversi tipi di media, combinando testo, immagini, audio, video e codice di programmazione.
"Questa nuova era di modelli rappresenta uno dei più grandi sforzi scientifici e ingegneristici che abbiamo intrapreso come azienda", ha dichiarato Sundar Pichai, CEO di Google, in un post sul blog.
Bard, il chatbot AI proprietario di Google, è già stato aggiornato con una versione del modello Gemini, ha dichiarato mercoledì l'azienda, che ha in programma di aggiungere Gemini a prodotti ampiamente utilizzati, tra cui il motore di ricerca di Google e il browser web Chrome, utilizzati da miliardi di persone in tutto il mondo.
L'annuncio segna un tentativo di reclamare l'iniziativa dopo che Google e altri giganti tecnologici sono stati apparentemente colti di sorpresa un anno fa con l'improvviso e massiccio rilascio di ChatGPT di OpenAI, che ha dato il via a una corsa a livello industriale per accelerare gli strumenti di IA generativa e a un dibattito globale sui rischi e i benefici dell'IA.
Rappresenta anche uno sforzo per spingere l'IA generativa fino ai confini più remoti dell'impero di Google. L'azienda ha dichiarato che Gemini 1.0 è disponibile in tre diverse dimensioni: Nano, ottimizzato per i dispositivi mobili e gli sviluppatori di app; Pro, che è il modello predefinito progettato per un'ampia gamma di attività e clienti; e Ultra, il modello di IA più sofisticato che Google afferma di aver mai costruito e che è ancora in fase di test di sicurezza.
Il lancio di mercoledì è stato pensato anche per mostrare i progressi di Google nel cloud computing, una risorsa fondamentale per gli sviluppatori di IA. L'azienda ha dichiarato di aver addestrato Gemini utilizzando una nuova generazione di potenti processori basati sul cloud, in grado di addestrare collettivamente modelli di IA di grandi dimensioni a una velocità quasi tripla rispetto alla versione precedente. Questa tecnologia, che sarà messa a disposizione anche dei clienti cloud di Google, potrebbe rappresentare una spinta significativa per il settore dell'IA in generale, rendendo più accessibile l'addestramento dell'IA e rafforzando la posizione di Google al terzo posto nel mercato dei servizi cloud pubblici. Ma non è chiaro come i chip AI di Google si collochino rispetto a quelli dei principali produttori di chip come Nvidia.
Nei test condotti, il modello Gemini di Google ha superato i modelli di IA rivali in oltre due dozzine di benchmark comunemente utilizzati dai ricercatori di IA per valutare la capacità di lettura, l'abilità matematica e le capacità di ragionamento multistep di un algoritmo, ha dichiarato l'azienda.
"Vediamo che questo sistema apre nuove frontiere in tutti i settori", ha dichiarato Eli Collins, vicepresidente del prodotto di Google DeepMind, nel corso di una teleconferenza tenutasi martedì.
Ma sembra riconoscere il rischio che i modelli di IA forniscano agli utenti risultati fuorvianti, alludendo alle preoccupazioni di gruppi della società civile, politici e ricercatori di IA.
Google ha fatto "molto lavoro per migliorare la fattualità in Gemini", ha detto Collins, ma i modelli linguistici di grandi dimensioni "sono ancora in grado di avere allucinazioni", un termine che i ricercatori di IA usano quando i sistemi di IA inventano fatti e sbagliano, ma con estrema sicurezza.
"Quando integriamo questi modelli in prodotti come Bard, disponiamo di tecniche aggiuntive per migliorare l'accuratezza delle risposte", ha aggiunto.
Riconoscendo questi rischi, Google ha dichiarato mercoledì che Gemini Ultra, la versione più avanzata del modello, sarà rilasciata gradualmente solo a "clienti selezionati, sviluppatori, partner ed esperti di sicurezza e responsabilità per una prima sperimentazione e un feedback, prima di essere distribuita agli sviluppatori e ai clienti aziendali all'inizio del prossimo anno".
Gemini Ultra è attualmente sottoposto a valutazioni di sicurezza da parte di terzi, note anche come red-teaming, in conformità con un impegno preso con l'amministrazione Biden all'inizio dell'estate.
Clare Duffy della CNN ha contribuito a questo servizio.
Leggi anche:
- Telefónica punta al lancio sul mercato della telefonia con ologrammi
- vzbv: Le aziende di Internet continuano a imbrogliare nonostante il divieto
- Telefónica punta al lancio sul mercato della telefonia con ologrammi nel 2026
- Miglioramento minimo dell'ecobilancio dei sistemi informatici del governo federale
Fonte: edition.cnn.com