Gemini é a resposta da Google ao GPT-4

Saiba mais sobre o mais recente modelo de linguagem de grande dimensão da Google.

2023 Dezembro 7 . 5:19 PM

4 minuto ler

Gemini é a resposta da Google ao GPT-4

O Google Gemini é o mais recente (e melhor) modelo de linguagem de IA da Google e oferece capacidades sólidas que rivalizam com as do GPT-4 da OpenAI. No entanto, com todos os lançamentos recentes de chatbots e sistemas de IA, pode ser um pouco difícil compreender exatamente o que é o Gemini e como o pode utilizar.

O que é o Google Gemini?

A resposta simples é que o Gemini é a resposta do Google ao GPT-4, o modelo de linguagem grande (LLM) que alimenta o ChatGPT Plus e o Copilot da Microsoft. É o modelo mais atualizado e capaz que o gigante das pesquisas criou até agora, e planeia utilizá-lo de inúmeras formas.

Quem pode utilizar o Gemini?

Qualquer pessoa pode utilizar o Gemini, no entanto, não o vai utilizar como o ChatGPT. Como referi acima, o Gemini é o modelo de linguagem que irá executar o chatbot de IA da Google, à semelhança da forma como o GPT executa as coisas nos bastidores do ChatGPT. Como tal, não poderá ir ao site da Google e começar a falar com o Gemini. Em vez disso, terá de utilizar uma das suas três versões diferentes para criar uma aplicação que aproveite o poder que o Gemini oferece. Em alternativa, pode esperar que outra pessoa crie uma - ou utilizar o Bard, o chatbot da Google, para ver o que o Gemini tem para oferecer quando for atualizado.

O Gemini tem três níveis

A Google concebeu o Gemini 1.0 para oferecer três tamanhos diferentes, ou níveis. Estes tamanhos foram concebidos para ajudar o modelo a tirar o máximo partido das suas capacidades para tarefas complexas, tarefas quotidianas e tarefas no dispositivo.

O Gemini Ultra é a versão maior e mais capaz do Google Gemini e será utilizado para concluir as tarefas mais complexas que o Gemini pode realizar. Esta será provavelmente uma das principais versões vistas por detrás do Bard Advanced e de outros chatbots de IA que utilizam o Gemini para tarefas extensas e complexas e oferecerá o desempenho mais avançado dos três.

O Gemini Pro é o que o Google considera o "melhor modelo para escalonamento" e a empresa diz que ele será capaz de lidar com uma ampla gama de tarefas, oferecendo desempenho de última geração. É o plano intermédio, que será provavelmente o mais utilizado e está atualmente disponível para ser experimentado no Bard.

O Gemini Nano é a versão mais pequena e eficiente do modelo e a Google afirma que foi concebido para funcionar em dispositivos tão pequenos como os smartphones. A empresa já planeja utilizar o Gemini Nano nos smartphones Pixel 8 e Pixel 8 Pro, onde espera permitir que a IA expanda a forma como usamos nossos dispositivos no futuro.

Como o Gemini se compara ao GPT-4?

Como observei acima, o Google quer que o Gemini seja sua resposta ao GPT-4 da OpenAI. De acordo com algumas das estatísticas que a Google partilhou no seu anúncio oficial, o novo modelo resiste muito bem ao GPT-4V (GPT-4 com visão) e a outros modelos também. A Google afirma que o Gemini consegue atingir 59,4% quando comparado com o MMMU (problemas de raciocínio multidisciplinares de nível universitário), enquanto o GPT-4V atinge 56,8%.

Comparações entre o Gemini e o GPT-4V e outros modelos.Crédito: Google

As diferenças entre os dois não são surpreendentes, de forma alguma, mas o desempenho do Gemini deverá levar a OpenAI a melhorar ainda mais o GPT-4. Este tipo de competição é excecionalmente útil para os consumidores, pois garante que ambos os modelos continuarão a melhorar no futuro, à medida que tentam acompanhar e superar o outro.

A Google afirma que o Gemini foi treinado para reconhecer e compreender texto, áudio, imagens e muito mais, tudo ao mesmo tempo. Este raciocínio mais sofisticado deverá permitir ao modelo lidar com tudo o que lhe for apresentado, embora o tempo dirá exatamente qual o seu desempenho em aplicações do mundo real.

O Gemini é exato?

Como qualquer modelo linguístico de IA, o Gemini é suscetível de alucinar e gerar más informações. Embora a empresa não tenha partilhado quaisquer dados específicos sobre a exatidão do Gemini em termos comparativos, será sempre importante verificar novamente qualquer informação que o modelo lhe devolva antes de a publicar em qualquer lugar. Dito isto, estes sistemas de IA continuarão, sem dúvida, a tornar-se mais precisos ao longo do tempo, embora o risco de alucinações esteja sempre presente.

Quando é que posso desenvolver com o Gemini?

Se você estiver interessado em desenvolver com o Gemini, o Google diz que vai liberar o acesso do desenvolvedor para o Gemini Pro e a API Gemini a partir de 13 de dezembro. O Gemini Ultra ainda está previsto para "breve", uma vez que a Google diz que está a passar por extensas verificações de confiança e segurança neste momento. A Google ainda não partilhou qualquer informação relacionada com os preços do Gemini neste momento. A Google também não partilhou o tipo de caracteres ou limites de contexto com que o Gemini irá trabalhar, embora eu espere que essa informação seja divulgada assim que os utilizadores tenham acesso aberto ao modelo. Sabemos que o limite de caracteres do ChatGPT é de cerca de 4.000 caracteres (com base na pesquisa da comunidade), por isso é provável que vejamos uma abordagem semelhante com o Gemini.

Comentários

Mais recente

No drama de Christy Hall, titulado 'Daddio', Sean Penn e Dakota Johnson compartilham uma viagem...

Viagens

Qantas emite desculpas sinceras após exibição de filme inadequado em todas as telas de bordo durante a viagem de Sydney a Tóquio

Passageiros em um recente voo da Qantas ficaram surpresos ao assistir a um filme explicitamente sexual em todas as telas do voo.

, and Viktoriya Miller

2024 Outubro 8

Paga Membros Pública

Neste foto ilustrativa tirada em 15 de setembro de 2017, o símbolo do aplicativo Telegram é...

Temas quentes

O Telegram serve como uma plataforma para operações comerciais clandestinas para sindicatos criminosos em todo o Sudeste Asiático, segundo a afirmação da ONU.

Síndicatos do crime organizado na Ásia sudeste aproveitam significativamente o aplicativo de mensagens Telegram, o que resulta em uma significativa mudanças em como eles participam de operações ilícitas em grande escala, segundo um comunicado emitido pelas Nações Unidas na segunda-feira.

, and Ann Bradley

2024 Outubro 8

Paga Membros Pública

Kamala Harris, a Vice-Presidente e contendora pela nominee presidencial democrata, fala a uma...

Política

5 ideias-chave da discussão solo de Kamala Harris com o '60 Minutes'

A Vice-Presidente Kamala Harris enfrentou uma hampir rigorosa sobre o financiamento de suas propostas econômicas, o suposto atraso na implementação de políticas de segurança nas fronteiras pelos democratas, sua estratégia para lidar com o conflito da Rússia na Ucrânia, entre outros tópicos, em...

, and Ksenia Johnson

2024 Outubro 8

Paga Membros Pública

Rodrigo Duterte, presidente das Filipinas, pronuncia discurso em reunião no Base Aérea de Villamor,...

Temas quentes

O ex-presidente das Filipinas, Duterte, pretende concorrer ao cargo de prefeito, ignorando sua controversa história de campanha fatal contra as drogas.

Em um movimento que surpreendeu muitos, o ex-presidente das Filipinas Rodrigo Duterte declarou sua intenção de concorrer ao cargo de prefeito em seu distrito natal, apesar da investigação em andamento pelo Tribunal Penal Internacional sobre sua famosa campanha contra as drogas, que alguns...

, and John Stellmacher

2024 Outubro 8

Paga Membros Pública

Gemini é a resposta da Google ao GPT-4

Gemini é a resposta da Google ao GPT-4

O que é o Google Gemini?

Quem pode utilizar o Gemini?

O Gemini tem três níveis

Como o Gemini se compara ao GPT-4?

O Gemini é exato?

Quando é que posso desenvolver com o Gemini?

Leia também:

Comentários

Relacionado

Mais recente