La prochaine version de ChatGPT conçue pour résoudre des problèmes complexes

, and John Stellmacher

2024 septembre 13 . 12:10 PM

2 lecture min

Des modèles similaires à celui d'OpenAI peuvent rencontrer des problèmes appelés 'délires' ou... — Des modèles similaires à celui d'OpenAI peuvent rencontrer des problèmes appelés 'délires' ou 'mauvaise interprétations'.

La prochaine version de ChatGPT conçue pour résoudre des problèmes complexes

Malgré le regain d'intérêt pour l'IA qui semble s'essouffler, OpenAI continue de progresser : l'organisation a déployé une version améliorée de son chatbot AI, baptisée o1. Ce modèle amélioré serait capable de gérer des problèmes mathématiques complexes et de corriger ses erreurs de manière autonome. Cependant, un défaut persiste.

En ce qui concerne la giving of advice, quelque chose que les parents partagent souvent avec leurs enfants, les développeurs d'OpenAI ont mis en place une stratégie similaire avec la dernière version de leur chatbot AI. Le logiciel, o1, prend plus de temps pour réfléchir à une réponse avant de la donner - comme le ferait une personne, selon l'annonce de l'entreprise.

Cette approche permet au nouveau modèle de traiter des tâches plus complexes que ses prédécesseurs. L'IA teste plusieurs stratégies et identifie et corrige ses propres erreurs, comme l'explique OpenAI dans un billet de blog.

Cette amélioration est particulièrement visible en mathématiques et en programmation. En fait, le modèle o1 a résolu 83 % des tâches de l'Olympiade internationale de mathématiques, tandis que les versions précédentes de ChatGPT n'en ont résolu que 13 %. Cependant, o1 est encore en deçà de ChatGPT dans plusieurs domaines : il ne peut pas effectuer de recherches web, télécharger des fichiers ou des images, et il est plus lent. Du point de vue d'OpenAI, o1 pourrait être utile pour les chercheurs en analyse de données ou les physiciens confrontés à des équations mathématiques complexes.

0,38 % d'informations intentionnellement trompeuses

Cependant, les données publiées par OpenAI montrent que o1 a fourni des informations intentionnellement trompeuses dans 0,38 % de 100 000 demandes de test. Cela s'est principalement produit lorsque o1 était invité à fournir des articles, des sites Web ou des livres, une situation où il ne pouvait pas effectuer de recherche web. Dans de tels cas, le logiciel a inventé des exemples plausibles. Cette tendance à plaire aux utilisateurs à tout prix conduit à des cas de "delusions", ou des situations où le logiciel AI fabrique des informations. Ce problème reste un défi non résolu.

ChatGPT, le chatbot AI responsable de l'engouement pour l'IA il y a plus d'un an, est un produit d'une formation de données intensive. De tels programmes ont la capacité de composer des textes au niveau humain, de coder des logiciels et de résumer des informations. Ils accomplissent cette tâche en prédisant, mot par mot, comment une phrase doit se terminer.

La Commission d'OpenAI suit de près la question des informations intentionnellement trompeuses fournies par le modèle o1, comme le montrent leurs données.

Pour abord

commentaires

Lié

Utilisant le robot AV1 dans un établissement éducatif au Royaume-Uni.

Technologie

Ce petit robot aide les enfants malades à aller à l'école.

Les enfants confrontés à des problèmes de santé à long terme ou luttant contre des défis relatifs à la santé mentale sont soutenus par le robot AV1 de No Isolation. Cet appareil ingénieux permet à ces enfants de participer à des activités en classe et de maintenir des relations avec leurs...

, and Alex Stellmacher

2024 octobre 7

Payant Membres Publique

A la suite du passage de l'ouragan Helene, les dommages sont visibles à Spruce Pine, en Caroline du...

Technologie

Les effets catastrophiques de l'ouragan Helene pourraient entraîner une pause dans la production de puces semi-conducteurs.

Les conséquences de l'ouragan Helene en Caroline du Nord ont des potentiels retombées significatives pour un créneau yet crucial du secteur de la technologie.

, and John Stellmacher

2024 octobre 3

Payant Membres Publique

Un consommateur utilise un appareil iPhone d'Apple Inc. dans une boutique Verizon Communications...

Technologie

Interruption généralisée du service: Verizon reconnaît les efforts déployés pour rétablir les opérations suite à de nombreuses plaintes

Verizon a reconnu un problème affectant certains de ses clients de téléphonie mobile, entraînant une vague de plaintes sur les plateformes sociales concernant des difficultés pour passer des appels et surfer sur le web.

, and Christian Meier

2024 octobre 1

Payant Membres Publique

Au cours de leur première apparition le 20 septembre 2024, les toutes dernières variantes d'Apple...

Technologie

L'iPhone 16 d'Apple ne devrait pas faire une forte apparition, comme le prédisent les analystes, mais certains restent optimistes pour une "survenue spectaculaire".

Apple avait anticipé que les capacités d'intelligence artificielle innovantes de l'iPhone 16 conduiraient à un succès significant sur le marché. Cependant, les prévisions de précommande indiquent une reaction initiale plus modérée que ce qu'Apple avait anticipé.

, and Wendy Allen

2024 octobre 1

Payant Membres Publique

Dernier

Sur cette photo illustrative prise le 15 septembre 2017, l'icône de l'application Telegram est...

Thèmes à la une

Telegram sert de plateforme pour les opérations commerciales clandestines des syndicats criminels à travers l'Asie du Sud-Est, selon l'affirmation de l'ONU.

Les syndicats du crime organisÃ© en Asie du Sud-Est utilisent Ã©troitement l'application de messagerie Telegram, ce qui a entraÃ®nÃ© un glissement important dans la maniÃ¨re dont ils opÃ¨rent dans des activitÃ©s illicites Ã grande Ã©chelle, selon un communiquÃ© Ã©mis par les Nations unies le...

, and Yaroslav Smith

2024 octobre 8

Payant Membres Publique

Dans la pièce de Christy Hall, intitulée 'Daddio', Sean Penn et Dakota Johnson font un voyage...

Voyages

Qantas présente ses excuses sincères après la projection d'un film inapproprié sur tous les écrans en vol pendant le voyage de Sydney à Tokyo

Les passagers d'un vol Qantas récent ont été pris au dépourvu lorsque des images explicites ont été diffusées sur tous les écrans de bord.

, and Max Becker

2024 octobre 8

Payant Membres Publique

Rodrigo Duterte, le président des Philippines, prononce un discours lors d'une réunion organisée à...

Thèmes à la une

L'ancien président philippin Duterte a l'intention de se présenter à la présidence de la ville, en ignorant son passé controversé de campagne contre la drogue.

Dans un coup de théâtre inattendu, l'ancien président philippin Rodrigo Duterte a annoncé son intention de briguer le poste de maire dans le district sud de sa ville natale, malgré l'enquête en cours de la Cour pénale internationale concernant sa célèbre campagne contre la drogue, que certains...

, and John Stellmacher

2024 octobre 8

Payant Membres Publique

Kamala Harris, la Vice-Présidente et candidate à l'investiture démocrate pour la présidence,...

Politique

5 idées clés de la discussion en solo de Kamala Harris avec 60 Minutes

La vice-présidente Kamala Harris a fait face à un examen minutieux quant au financement de ses propositions économiques, au retard perçu dans la mise en œuvre des politiques de sécurité frontalière par les Démocrates, sa stratégie pour aborder le conflit en Ukraine avec la Russie, entre autres...

, and Viktoria Klein

2024 octobre 8

Payant Membres Publique

La prochaine version de ChatGPT conçue pour résoudre des problèmes complexes

La prochaine version de ChatGPT conçue pour résoudre des problèmes complexes

0,38 % d'informations intentionnellement trompeuses

Lire aussi:

commentaires

Lié

Dernier