Gemini é a resposta da Google ao GPT-4
O Google Gemini é o mais recente (e melhor) modelo de linguagem de IA da Google e oferece capacidades sólidas que rivalizam com as do GPT-4 da OpenAI. No entanto, com todos os lançamentos recentes de chatbots e sistemas de IA, pode ser um pouco difícil compreender exatamente o que é o Gemini e como o pode utilizar.
O que é o Google Gemini?
A resposta simples é que o Gemini é a resposta do Google ao GPT-4, o modelo de linguagem grande (LLM) que alimenta o ChatGPT Plus e o Copilot da Microsoft. É o modelo mais atualizado e capaz que o gigante das pesquisas criou até agora, e planeia utilizá-lo de inúmeras formas.
Quem pode utilizar o Gemini?
Qualquer pessoa pode utilizar o Gemini, no entanto, não o vai utilizar como o ChatGPT. Como referi acima, o Gemini é o modelo de linguagem que irá executar o chatbot de IA da Google, à semelhança da forma como o GPT executa as coisas nos bastidores do ChatGPT. Como tal, não poderá ir ao site da Google e começar a falar com o Gemini. Em vez disso, terá de utilizar uma das suas três versões diferentes para criar uma aplicação que aproveite o poder que o Gemini oferece. Em alternativa, pode esperar que outra pessoa crie uma - ou utilizar o Bard, o chatbot da Google, para ver o que o Gemini tem para oferecer quando for atualizado.
O Gemini tem três níveis
A Google concebeu o Gemini 1.0 para oferecer três tamanhos diferentes, ou níveis. Estes tamanhos foram concebidos para ajudar o modelo a tirar o máximo partido das suas capacidades para tarefas complexas, tarefas quotidianas e tarefas no dispositivo.
O Gemini Ultra é a versão maior e mais capaz do Google Gemini e será utilizado para concluir as tarefas mais complexas que o Gemini pode realizar. Esta será provavelmente uma das principais versões vistas por detrás do Bard Advanced e de outros chatbots de IA que utilizam o Gemini para tarefas extensas e complexas e oferecerá o desempenho mais avançado dos três.
O Gemini Pro é o que o Google considera o "melhor modelo para escalonamento" e a empresa diz que ele será capaz de lidar com uma ampla gama de tarefas, oferecendo desempenho de última geração. É o plano intermédio, que será provavelmente o mais utilizado e está atualmente disponível para ser experimentado no Bard.
O Gemini Nano é a versão mais pequena e eficiente do modelo e a Google afirma que foi concebido para funcionar em dispositivos tão pequenos como os smartphones. A empresa já planeja utilizar o Gemini Nano nos smartphones Pixel 8 e Pixel 8 Pro, onde espera permitir que a IA expanda a forma como usamos nossos dispositivos no futuro.
Como o Gemini se compara ao GPT-4?
Como observei acima, o Google quer que o Gemini seja sua resposta ao GPT-4 da OpenAI. De acordo com algumas das estatísticas que a Google partilhou no seu anúncio oficial, o novo modelo resiste muito bem ao GPT-4V (GPT-4 com visão) e a outros modelos também. A Google afirma que o Gemini consegue atingir 59,4% quando comparado com o MMMU (problemas de raciocínio multidisciplinares de nível universitário), enquanto o GPT-4V atinge 56,8%.
Comparações entre o Gemini e o GPT-4V e outros modelos.Crédito: Google
As diferenças entre os dois não são surpreendentes, de forma alguma, mas o desempenho do Gemini deverá levar a OpenAI a melhorar ainda mais o GPT-4. Este tipo de competição é excecionalmente útil para os consumidores, pois garante que ambos os modelos continuarão a melhorar no futuro, à medida que tentam acompanhar e superar o outro.
A Google afirma que o Gemini foi treinado para reconhecer e compreender texto, áudio, imagens e muito mais, tudo ao mesmo tempo. Este raciocínio mais sofisticado deverá permitir ao modelo lidar com tudo o que lhe for apresentado, embora o tempo dirá exatamente qual o seu desempenho em aplicações do mundo real.
O Gemini é exato?
Como qualquer modelo linguístico de IA, o Gemini é suscetível de alucinar e gerar más informações. Embora a empresa não tenha partilhado quaisquer dados específicos sobre a exatidão do Gemini em termos comparativos, será sempre importante verificar novamente qualquer informação que o modelo lhe devolva antes de a publicar em qualquer lugar. Dito isto, estes sistemas de IA continuarão, sem dúvida, a tornar-se mais precisos ao longo do tempo, embora o risco de alucinações esteja sempre presente.
Quando é que posso desenvolver com o Gemini?
Se você estiver interessado em desenvolver com o Gemini, o Google diz que vai liberar o acesso do desenvolvedor para o Gemini Pro e a API Gemini a partir de 13 de dezembro. O Gemini Ultra ainda está previsto para "breve", uma vez que a Google diz que está a passar por extensas verificações de confiança e segurança neste momento. A Google ainda não partilhou qualquer informação relacionada com os preços do Gemini neste momento. A Google também não partilhou o tipo de caracteres ou limites de contexto com que o Gemini irá trabalhar, embora eu espere que essa informação seja divulgada assim que os utilizadores tenham acesso aberto ao modelo. Sabemos que o limite de caracteres do ChatGPT é de cerca de 4.000 caracteres (com base na pesquisa da comunidade), por isso é provável que vejamos uma abordagem semelhante com o Gemini.
Leia também:
- A Telefónica pretende lançar no mercado a telefonia por holograma
- vzbv: As empresas de Internet continuam a fazer batota apesar da proibição
- A Telefónica prevê o lançamento no mercado da telefonia por holograma em 2026
- Quase nenhuma melhoria no equilíbrio ecológico dos sistemas informáticos do governo federal
Fonte: aussiedlerbote.de