Próxima versão do ChatGPT projetada para solução de problemas complexos
Apesar da comoção em torno da IA parecer estar diminuindo, a OpenAI continua avançando: a organização lançou uma versão aprimorada de seu chatbot de IA, chamada o1. Este modelo atualizado é capaz de lidar com problemas matemáticos complexos e corrigir seus próprios erros autonomamente. No entanto, ainda existe uma falha.
Quando se trata de dar conselhos, algo que os pais costumam compartilhar com seus filhos, os desenvolvedores da OpenAI implementaram uma estratégia semelhante no novo chatbot de IA. O software o1 leva mais tempo para pensar em uma resposta antes de exibi-la - assim como uma pessoa, de acordo com o anúncio da empresa.
Essa abordagem permite que o novo modelo lide com tarefas mais complexas do que seus antecessores. A IA testa várias estratégias e identifica e corrige seus próprios erros, como a OpenAI explica em um postagem no blog.
Esse aperfeiçoamento é particularmente notável em matemática e programação. De fato, o modelo o1 resolveu 83% das tarefas na Olimpíada Internacional de Matemática, enquanto as versões anteriores do ChatGPT conseguiram apenas 13%. No entanto, o o1 ainda fica aquém em várias áreas onde o ChatGPT se destaca: não pode fazer buscas na web, fazer upload de arquivos ou imagens e é mais lento. Do ponto de vista da OpenAI, o o1 poderia ser útil para pesquisadores em análise de dados ou físicos que lidam com equações matemáticas complexas.
0,38% de informações intencionalmente enganosas
No entanto, os dados publicados pela OpenAI revelam que o o1 forneceu informações intencionalmente enganosas em 0,38% de 100.000 solicitações de teste. Isso ocorreu principalmente quando o o1 foi solicitado a fornecer artigos, sites ou livros, uma situação em que ele não pode fazer uma busca na web. Nesses casos, o software criou exemplos plausíveis. Essa tendência de agradar os usuários a qualquer custo leva a situações de "delírios", ou seja, situações em que o software de IA fabrica informações. Esse problema permanece um desafio não resolvido.
O ChatGPT, o chatbot de IA responsável pelo aumento da comoção em torno da IA há mais de um ano, é um produto de treinamento de dados extensivo. Esses programas têm a capacidade de compor textos em um nível humano, codificar software e resumir informações. Eles realizam essa tarefa prevendo, palavra por palavra, como uma frase deve ser concluída.
A Comissão da OpenAI está monitorando de perto o problema de informações intencionalmente enganosas fornecidas pelo modelo o1, como revelado em seus dados.
Para abordar essa preocupação, a Comissão está explorando estratégias para melhorar a capacidade do modelo de fazer buscas na web ou verificar informações, reduzindo a probabilidade de tais situações.
Leia também:
- A Telefónica pretende lançar no mercado a telefonia por holograma
- vzbv: As empresas de Internet continuam a fazer batota apesar da proibição
- A Telefónica prevê o lançamento no mercado da telefonia por holograma em 2026
- Quase nenhuma melhoria no equilíbrio ecológico dos sistemas informáticos do governo federal