Per saperne di più sul nuovo modello linguistico di Google. - Gemini è la risposta di Google al GPT-4
Google Gemini è l'ultimo (e il più grande) modello linguistico di IA di Google e si propone di offrire solide capacità che rivaleggiano con quelle del GPT-4 di OpenAI. Con tutti i recenti rilasci di chatbot e sistemi di intelligenza artificiale, però, capire esattamente cos'è Gemini e come si può usare potrebbe essere un po' difficile.
Che cos'è Google Gemini?
La risposta semplice è che Gemini è la risposta di Google al GPT-4, il modello linguistico di grandi dimensioni (LLM) che alimenta ChatGPT Plus e Copilot di Microsoft. È il modello più aggiornato e capace che il gigante della ricerca ha creato finora e prevede di utilizzarlo in una miriade di modi.
Chi può usare Gemini?
Chiunque può usare Gemini, ma non lo userete come ChatGPT. Come ho notato sopra, Gemini è il modello linguistico che gestirà il chatbot AI di Google, in modo simile a come GPT gestisce le cose dietro le quinte in ChatGPT. Pertanto, non sarà possibile andare sul sito web di Google e iniziare a parlare con Gemini. Dovrete invece utilizzare una delle sue tre diverse versioni per creare un'applicazione che sfrutti la potenza offerta da Gemini. In alternativa, si può aspettare che qualcun altro ne crei una o utilizzare Bard, il chatbot di Google, per vedere cosa ha da offrire Gemini una volta aggiornato.
Gemini ha tre livelli
Google ha progettato Gemini 1.0 per offrire tre diverse dimensioni, o livelli. Queste dimensioni sono state progettate per aiutare il modello a sfruttare al meglio le sue capacità per attività complesse, attività quotidiane e attività sul dispositivo.
Gemini Ultra è la versione più grande e più capace di Google Gemini e sarà utilizzata per completare le attività più complesse che Gemini può gestire. Questa sarà probabilmente una delle versioni principali dietro Bard Advanced e altri chatbot AI che utilizzano Gemini per compiti estesi e complessi e offrirà le prestazioni di nuova generazione più elevate tra le tre.
Gemini Pro è quello che Google considera il "modello migliore per la scalabilità" e l'azienda afferma che sarà in grado di gestire un'ampia gamma di attività offrendo prestazioni all'avanguardia. È il piano intermedio, che probabilmente sarà il più utilizzato ed è attualmente disponibile per essere provato a Bard.
Gemini Nano è la versione più piccola ed efficiente del modello e Google afferma che è stato progettato per funzionare su dispositivi piccoli come gli smartphone. L'azienda prevede già di utilizzare Gemini Nano negli smartphone Pixel 8 e Pixel 8 Pro, dove spera di permettere all'intelligenza artificiale di espandere il modo in cui utilizziamo i nostri dispositivi in futuro.
Come si colloca Gemini rispetto a GPT-4?
Come ho notato sopra, Google vuole che Gemini sia la sua risposta al GPT-4 di OpenAI. Secondo alcune statistiche condivise da Google nel suo annuncio ufficiale, il nuovo modello è in grado di competere molto bene con il GPT-4V (GPT-4 con visione) e con altri modelli. Google afferma che Gemini può raggiungere il 59,4% quando viene sottoposto a benchmark in MMMU (problemi di ragionamento multidisciplinare di livello universitario), mentre GPT-4V raggiunge il 56,8%.
Benchmark che mostrano il confronto tra Gemini e GPT-4V e altri modelli.Credit: Google
Le differenze tra i due modelli non sono assolutamente sbalorditive, ma le prestazioni di Gemini dovrebbero, si spera, spingere OpenAI a migliorare ulteriormente GPT-4. Questo tipo di concorrenza è straordinariamente utile per i consumatori, in quanto garantisce che entrambi i modelli continuino a migliorare in futuro, cercando di tenere il passo e di superare l'altro.
Google afferma che Gemini è stato addestrato a riconoscere e comprendere testo, audio, immagini e altro ancora, tutto allo stesso tempo. Questo ragionamento più sofisticato dovrebbe consentire al modello di gestire qualsiasi cosa gli venga proposta, anche se il tempo ci dirà esattamente quanto è bravo nelle applicazioni reali.
Gemini è preciso?
Come ogni modello linguistico di intelligenza artificiale, Gemini è suscettibile di avere allucinazioni e generare informazioni errate. Sebbene l'azienda non abbia condiviso alcuna specifica sull'accuratezza di Gemini in termini comparativi, sarà sempre importante ricontrollare tutte le informazioni restituite dal modello prima di pubblicarle. Detto questo, questi sistemi di intelligenza artificiale continueranno senza dubbio a diventare più precisi nel tempo, anche se il rischio di allucinazioni sarà sempre presente.
Quando posso sviluppare con Gemini?
Se siete interessati a sviluppare con Gemini, Google afferma che rilascerà l'accesso agli sviluppatori per Gemini Pro e Gemini API a partire dal 13 dicembre. Gemini Ultra è ancora indicato come "in arrivo", in quanto Google afferma che al momento sta lavorando su controlli approfonditi di fiducia e sicurezza. Al momento Google non ha ancora condiviso alcuna informazione sui prezzi di Gemini. Inoltre, Google non ha condiviso il tipo di limiti di carattere o di contesto con cui Gemini lavorerà, anche se mi aspetto che queste informazioni vengano fuori una volta che gli utenti avranno libero accesso al modello. Sappiamo che il limite di caratteri di ChatGPT è di circa 4.000 caratteri (in base alle ricerche della comunità), quindi è probabile che vedremo un approccio simile con Gemini.
Leggi anche:
- Telefónica punta al lancio sul mercato della telefonia con ologrammi
- vzbv: Le aziende di Internet continuano a imbrogliare nonostante il divieto
- Telefónica punta al lancio sul mercato della telefonia con ologrammi nel 2026
- Miglioramento minimo dell'ecobilancio dei sistemi informatici del governo federale
Fonte: aussiedlerbote.de