Modèle linguistique Gemini - Google veut semer la concurrence avec un nouveau modèle d'IA
Dans la course à l'intelligence artificielle, Google veut se placer en tête avec son nouveau modèle linguistique Gemini. Le système d'IA ne doit pas seulement rivaliser avec le modèle linguistique GPT4 du concurrent OpenAI, mais aussi le surpasser.
Le président de Google, Sundar Pichai, a déclaré à propos de l'annonce de Gemini que le changement que l'on vit actuellement avec l'IA sera "le plus profond de nos vies, bien plus grand que le passage au téléphone portable ou à Internet avant cela".
Gemini classe les gestes de la main et les dessins
Gemini peut non seulement générer des textes dans un chatbot, mais aussi résoudre certains problèmes et prendre des décisions en fonction de la situation. Il peut également enregistrer des informations à partir de photos et de vidéos. Google a fait la démonstration du système avec un chat vidéo au cours duquel Gemini a immédiatement reconnu et classé correctement les dessins et les gestes de la main de son interlocuteur humain.
"Nous apportons Gemini à des milliards de personnes via les produits Google", a annoncé le chef de Google DeepMind, Demis Hassabis. La filiale de Google avait été créée en avril 2023 à partir de la start-up britannique DeepMind, rachetée en 2014, et du département d'IA interne de Google. En intégrant la start-up, qui agissait jusqu'alors de manière largement indépendante, Pichai souhaitait regrouper les efforts d'IA au sein du groupe Google afin de pouvoir s'opposer plus résolument à OpenAI.
Trois dimensions prévues
Google introduira le nouveau système dans trois dimensions différentes : Gemini Ultra, Gemini Pro et Gemini Nano. Gemini Ultra est le modèle le plus grand et le plus performant pour les tâches très complexes. Cette variante s'adresse avant tout aux clients d'entreprise.
Gemini Pro s'adressera à un public plus large et apprendra par exemple au chatbot Google Bard à "penser, planifier, comprendre et plus encore" de manière avancée. "Il s'agit de la plus grande mise à niveau pour Bard depuis son lancement", a déclaré Hassabis. Bard sera disponible en anglais dans plus de 170 pays et territoires à partir de maintenant. Google prévoit toutefois de prendre en charge de nouvelles langues et de nouveaux sites dans un avenir proche.
Gemini devrait également fonctionner sur le smartphone de Google
La troisième variante de Gemini, Nano, apporte le système sur le modèle haut de gamme des smartphones Google, le Pixel. "Le Pixel 8 Pro est le premier smartphone à faire tourner Gemini Nano", a annoncé Hassabis. Cela permet par exemple, grâce à l'application Recorder, non seulement d'enregistrer le langage parlé lors d'une réunion prolongée, d'un cours ou d'une interview et de le convertir en temps réel en langage écrit. Avec l'aide de Gemini Nano, le Pixel peut également créer un résumé compact sans délai. Dans les mois à venir, Gemini sera disponible dans d'autres produits et services Google comme la recherche, les annonces publicitaires ou le navigateur Chrome.
Google travaille depuis des années sur des applications basées sur l'intelligence artificielle, mais est actuellement contraint d'en dévoiler davantage. Il y a un an, la start-up OpenAI a déclenché une nouvelle compétition en matière d'intelligence artificielle en rendant public son chatbot ChatGPT. Le logiciel a fait beaucoup parler de lui car il est capable de former des phrases comme un être humain. Il est entraîné avec d'énormes quantités de données et évalue mot par mot comment une phrase pourrait se poursuivre. Cela implique le risque qu'il puisse donner des informations totalement erronées.
Lire aussi:
- Telefónica vise le lancement commercial de la téléphonie par hologramme
- vzbv : Les groupes Internet continuent à tricher malgré l'interdiction
- Telefónica vise un lancement commercial de la téléphonie par hologramme en 2026
- L'écobilan des systèmes informatiques de la Confédération ne s'est guère amélioré
Source: www.stern.de