Gemini è la risposta di Google al GPT-4

Per saperne di più sul nuovo modello linguistico di Google.

2023 dicembre 7 . 5:18 PM

4 minuti

Gemini è la risposta di Google al GPT-4.aussiedlerbote.de

Per saperne di più sul nuovo modello linguistico di Google. - Gemini è la risposta di Google al GPT-4

Google Gemini è l'ultimo (e il più grande) modello linguistico di IA di Google e si propone di offrire solide capacità che rivaleggiano con quelle del GPT-4 di OpenAI. Con tutti i recenti rilasci di chatbot e sistemi di intelligenza artificiale, però, capire esattamente cos'è Gemini e come si può usare potrebbe essere un po' difficile.

Che cos'è Google Gemini?

La risposta semplice è che Gemini è la risposta di Google al GPT-4, il modello linguistico di grandi dimensioni (LLM) che alimenta ChatGPT Plus e Copilot di Microsoft. È il modello più aggiornato e capace che il gigante della ricerca ha creato finora e prevede di utilizzarlo in una miriade di modi.

Chi può usare Gemini?

Chiunque può usare Gemini, ma non lo userete come ChatGPT. Come ho notato sopra, Gemini è il modello linguistico che gestirà il chatbot AI di Google, in modo simile a come GPT gestisce le cose dietro le quinte in ChatGPT. Pertanto, non sarà possibile andare sul sito web di Google e iniziare a parlare con Gemini. Dovrete invece utilizzare una delle sue tre diverse versioni per creare un'applicazione che sfrutti la potenza offerta da Gemini. In alternativa, si può aspettare che qualcun altro ne crei una o utilizzare Bard, il chatbot di Google, per vedere cosa ha da offrire Gemini una volta aggiornato.

Gemini ha tre livelli

Google ha progettato Gemini 1.0 per offrire tre diverse dimensioni, o livelli. Queste dimensioni sono state progettate per aiutare il modello a sfruttare al meglio le sue capacità per attività complesse, attività quotidiane e attività sul dispositivo.

Gemini Ultra è la versione più grande e più capace di Google Gemini e sarà utilizzata per completare le attività più complesse che Gemini può gestire. Questa sarà probabilmente una delle versioni principali dietro Bard Advanced e altri chatbot AI che utilizzano Gemini per compiti estesi e complessi e offrirà le prestazioni di nuova generazione più elevate tra le tre.

Gemini Pro è quello che Google considera il "modello migliore per la scalabilità" e l'azienda afferma che sarà in grado di gestire un'ampia gamma di attività offrendo prestazioni all'avanguardia. È il piano intermedio, che probabilmente sarà il più utilizzato ed è attualmente disponibile per essere provato a Bard.

Gemini Nano è la versione più piccola ed efficiente del modello e Google afferma che è stato progettato per funzionare su dispositivi piccoli come gli smartphone. L'azienda prevede già di utilizzare Gemini Nano negli smartphone Pixel 8 e Pixel 8 Pro, dove spera di permettere all'intelligenza artificiale di espandere il modo in cui utilizziamo i nostri dispositivi in futuro.

Come si colloca Gemini rispetto a GPT-4?

Come ho notato sopra, Google vuole che Gemini sia la sua risposta al GPT-4 di OpenAI. Secondo alcune statistiche condivise da Google nel suo annuncio ufficiale, il nuovo modello è in grado di competere molto bene con il GPT-4V (GPT-4 con visione) e con altri modelli. Google afferma che Gemini può raggiungere il 59,4% quando viene sottoposto a benchmark in MMMU (problemi di ragionamento multidisciplinare di livello universitario), mentre GPT-4V raggiunge il 56,8%.

Benchmark che mostrano il confronto tra Gemini e GPT-4V e altri modelli.Credit: Google

Le differenze tra i due modelli non sono assolutamente sbalorditive, ma le prestazioni di Gemini dovrebbero, si spera, spingere OpenAI a migliorare ulteriormente GPT-4. Questo tipo di concorrenza è straordinariamente utile per i consumatori, in quanto garantisce che entrambi i modelli continuino a migliorare in futuro, cercando di tenere il passo e di superare l'altro.

Google afferma che Gemini è stato addestrato a riconoscere e comprendere testo, audio, immagini e altro ancora, tutto allo stesso tempo. Questo ragionamento più sofisticato dovrebbe consentire al modello di gestire qualsiasi cosa gli venga proposta, anche se il tempo ci dirà esattamente quanto è bravo nelle applicazioni reali.

Gemini è preciso?

Come ogni modello linguistico di intelligenza artificiale, Gemini è suscettibile di avere allucinazioni e generare informazioni errate. Sebbene l'azienda non abbia condiviso alcuna specifica sull'accuratezza di Gemini in termini comparativi, sarà sempre importante ricontrollare tutte le informazioni restituite dal modello prima di pubblicarle. Detto questo, questi sistemi di intelligenza artificiale continueranno senza dubbio a diventare più precisi nel tempo, anche se il rischio di allucinazioni sarà sempre presente.

Quando posso sviluppare con Gemini?

Se siete interessati a sviluppare con Gemini, Google afferma che rilascerà l'accesso agli sviluppatori per Gemini Pro e Gemini API a partire dal 13 dicembre. Gemini Ultra è ancora indicato come "in arrivo", in quanto Google afferma che al momento sta lavorando su controlli approfonditi di fiducia e sicurezza. Al momento Google non ha ancora condiviso alcuna informazione sui prezzi di Gemini. Inoltre, Google non ha condiviso il tipo di limiti di carattere o di contesto con cui Gemini lavorerà, anche se mi aspetto che queste informazioni vengano fuori una volta che gli utenti avranno libero accesso al modello. Sappiamo che il limite di caratteri di ChatGPT è di circa 4.000 caratteri (in base alle ricerche della comunità), quindi è probabile che vedremo un approccio simile con Gemini.

Commenti

Più recente

Viaggi

Qantas si scusa per la proiezione di film inappropriati su tutti gli schermi a bordo durante il viaggio da Sydney a Tokyo

I passeggeri di un recente volo Qantas sono rimasti sorpresi quando è stato trasmesso un film esplicito su tutti gli schermi di bordo.

, and Carmen Simpson

2024 ottobre 8

Abbonati Iscritti Pubblico

In questa foto illustrativa scattata il 15 settembre 2017, il simbolo dell'app Telegram appears on...

Temi-caldi

Telegram serve come piattaforma per operazioni commerciali clandestine per le organizzazioni criminali in tutto il Sud-Est asiatico, secondo l'affermazione dell'ONU.

I sindacati criminali del SudEst Asiatico utilizzano in modo significativo l'applicazione di messaggistica Telegram, ciò ha determinato un significativo cambiamento in come gestiscono operazioni illecite su larga scala, come si legge in una nota delle Nazioni Unite del lunedì.

, and Viktoria Klein

2024 ottobre 8

Abbonati Iscritti Pubblico

Kamala Harris, la Vicepresidente e concorrente per la nomination presidenziale democratica, si...

Politica

5 spunti chiave della discussione di Kamala Harris con '60 Minutes'

La vicepresidente Kamala Harris ha incontrato una forte attenzione riguardo al finanziamento delle sue proposte economiche, il presunto ritardo nell'implementazione delle politiche di sicurezza del confine da parte dei democratici, la sua strategia per affrontare il conflitto in Ucraina con la...

, and Hanna Hofmann

2024 ottobre 8

Abbonati Iscritti Pubblico

Il primo anniversario viene commemorato dai civili in un memoriale a Tel Aviv, in Israele, il 7...

Temi-caldi

Israele commemora l'anniversario dell'attacco terroristico del 7 ottobre, pieno di dolore e rabbia.

Con folle che si radunano in tutta Israele per commemorare l'anniversario degli attacchi terroristici che hanno provocato oltre 1200 morti, sono emerse notizie ricorrenti che il conflitto nella zona di guerra di Gaza continua senza sosta.

, and Carmen Simpson

2024 ottobre 8

Abbonati Iscritti Pubblico

Gemini è la risposta di Google al GPT-4

Per saperne di più sul nuovo modello linguistico di Google. - Gemini è la risposta di Google al GPT-4

Che cos'è Google Gemini?

Chi può usare Gemini?

Gemini ha tre livelli

Come si colloca Gemini rispetto a GPT-4?

Gemini è preciso?

Quando posso sviluppare con Gemini?

Leggi anche:

Commenti

Imparentato

Più recente