Gemini est la réponse de Google à GPT-4
Google Gemini est le dernier (et le meilleur) modèle de langage d'IA de Google, et il offre des capacités solides qui rivalisent avec le GPT-4 d'OpenAI. Cependant, avec toutes les versions récentes de chatbots et de systèmes d'IA, il peut être difficile de comprendre exactement ce qu'est Gemini et comment vous pouvez l'utiliser.
Qu'est-ce que Google Gemini ?
Gemini est la réponse de Google à GPT-4, le grand modèle linguistique (LLM) qui équipe ChatGPT Plus et Copilot de Microsoft. Il s'agit du modèle le plus récent et le plus performant que le géant de la recherche ait créé jusqu'à présent, et il prévoit de l'utiliser d'une multitude de façons.
Qui peut utiliser Gemini ?
Tout le monde peut utiliser Gemini, mais vous ne l'utiliserez pas comme ChatGPT. Comme je l'ai indiqué plus haut, Gemini est le modèle linguistique qui fera fonctionner le chatbot d'IA de Google, de la même manière que GPT fonctionne en coulisses dans ChatGPT. Vous ne pourrez donc pas vous rendre sur le site web de Google et commencer à parler à Gemini. Vous devrez utiliser l'une de ses trois versions pour créer une application qui exploite la puissance de Gemini. Vous pouvez également attendre que quelqu'un d'autre crée une application ou utiliser Bard, le chatbot de Google, pour voir ce que Gemini a à offrir une fois qu'il sera mis à jour.
Gemini comporte trois niveaux
Google a conçu Gemini 1.0 pour offrir trois tailles différentes, ou niveaux. Ces tailles sont conçues pour aider le modèle à tirer le meilleur parti de ses capacités pour les tâches complexes, les tâches quotidiennes et les tâches sur l'appareil.
Gemini Ultra est la version la plus grande et la plus performante de Google Gemini et elle sera utilisée pour effectuer les tâches les plus complexes que Gemini peut gérer. Il s'agira probablement de l'une des principales versions de Bard Advanced et d'autres chatbots IA qui utilisent Gemini pour des tâches étendues et complexes, et elle offrira les performances de nouvelle génération les plus élevées des trois.
Gemini Pro est ce que Google considère comme le "meilleur modèle de mise à l'échelle" et l'entreprise affirme qu'il sera capable de gérer un large éventail de tâches tout en offrant des performances de pointe. Il s'agit d'un plan intermédiaire, qui sera probablement le plus largement utilisé et qui est actuellement disponible à l'essai chez Bard.
Gemini Nano est la version la plus petite et la plus efficace du modèle et Google affirme qu'elle a été conçue pour fonctionner sur des appareils aussi petits que des smartphones. L'entreprise prévoit déjà d'utiliser Gemini Nano dans les smartphones Pixel 8 et Pixel 8 Pro, où elle espère laisser l'IA étendre la façon dont nous utilisons nos appareils à l'avenir.
Comment Gemini se compare-t-il à GPT-4 ?
Comme je l'ai noté ci-dessus, Google veut que Gemini soit sa réponse au GPT-4 d'OpenAI. D'après certaines statistiques communiquées par Google lors de son annonce officielle, le nouveau modèle résiste très bien au GPT-4V (GPT-4 avec vision) ainsi qu'à d'autres modèles. Google indique que Gemini peut atteindre 59,4 % lorsqu'il est comparé à MMMU (Multi-discipline college-level reasoning problems), alors que GPT-4V atteint 56,8 %.
Comparaison de Gemini avec GPT-4V et d'autres modèles.
Les différences entre les deux modèles ne sont pas stupéfiantes, loin de là, mais les performances de Gemini devraient, espérons-le, pousser OpenAI à améliorer encore GPT-4. Ce type de concurrence est exceptionnellement utile pour les consommateurs, car il garantit que les deux modèles continueront à s'améliorer à l'avenir, tout en essayant de se maintenir au niveau de l'autre et de le surpasser.
Google affirme que Gemini a été entraîné à reconnaître et à comprendre du texte, du son, des images et bien plus encore, en même temps. Ce raisonnement plus sophistiqué devrait permettre au modèle de gérer tout ce que vous lui proposez, mais l'avenir nous dira dans quelle mesure il est performant dans les applications réelles.
Gemini est-il précis ?
Comme tout modèle linguistique d'IA, Gemini est susceptible d'halluciner et de générer des informations erronées. Bien que l'entreprise n'ait pas donné de précisions sur le degré de précision de Gemini, il sera toujours important de vérifier les informations renvoyées par le modèle avant de les publier où que ce soit. Cela dit, ces systèmes d'IA continueront sans aucun doute à devenir plus précis au fil du temps, même si le risque d'hallucinations sera probablement toujours présent.
Quand puis-je développer avec Gemini ?
Si vous souhaitez développer avec Gemini, Google indique qu'il offrira un accès aux développeurs pour Gemini Pro et Gemini API à partir du 13 décembre. Gemini Ultra est toujours annoncé comme "bientôt disponible", car Google indique qu'il procède actuellement à des vérifications approfondies en matière de confiance et de sécurité. Google n'a pas encore communiqué d'informations sur les prix de Gemini. Google n'a pas non plus précisé le type de limites de caractère ou de contexte avec lesquelles Gemini fonctionnera, mais je m'attends à ce que ces informations soient dévoilées une fois que les utilisateurs auront un accès libre au modèle. Nous savons que la limite de caractères de ChatGPT est d'environ 4 000 caractères (d'après les recherches de la communauté), il est donc probable que nous verrons une approche similaire avec Gemini.
Lire aussi:
- Telefónica vise le lancement commercial de la téléphonie par hologramme
- vzbv : Les groupes Internet continuent à tricher malgré l'interdiction
- Telefónica vise un lancement commercial de la téléphonie par hologramme en 2026
- L'écobilan des systèmes informatiques de la Confédération ne s'est guère amélioré
Source: aussiedlerbote.de