Google lance Gemini, son modèle d'IA le plus avancé à ce jour, pour concurrencer ChatGPT
L'ampleur des ambitions de Google s'est reflétée dans l'annonce de l'entreprise, qui a présenté Gemini comme le "modèle d'IA le plus grand et le plus capable" de l'entreprise et a déclaré une "ère Gemini" qui prévoit que le modèle du géant de la technologie soit utilisé dans tous les contextes, des grandes entreprises aux appareils grand public tels que le Google Pixel 8 Pro.
Contrairement aux modèles d'IA existants qui ne traitent généralement qu'un seul type d'invite de l'utilisateur, comme exclusivement des images ou du texte, Gemini a été construit pour être "multimodal", a déclaré Google. Cela signifie qu'il accepte des entrées qui comprennent plusieurs types de médias, combinant texte, images, audio, vidéo et code de programmation.
"Cette nouvelle ère de modèles représente l'un des plus grands efforts de science et d'ingénierie que nous ayons entrepris en tant qu'entreprise", a déclaré Sundar Pichai, PDG de Google, dans un billet de blog.
Bard, le chatbot d'intelligence artificielle de Google, a déjà été mis à jour avec une version du modèle Gemini, a déclaré l'entreprise mercredi. Il est prévu d'ajouter Gemini à des produits largement utilisés, notamment le moteur de recherche de Google et le navigateur web Chrome, qui sont utilisés par des milliards de personnes dans le monde entier.
Cette annonce marque une tentative de reprendre l'initiative après que Google et d'autres géants de la technologie ont été apparemment pris par surprise il y a un an avec le lancement soudain et massivement populaire du ChatGPT d'OpenAI, qui a donné le coup d'envoi d'une course à l'industrie pour accélérer les outils d'IA générative et d'un débat mondial sur les risques et les avantages de l'IA.
Il s'agit également d'un effort pour pousser l'IA générative jusqu'aux confins de l'empire Google. La société a indiqué que Gemini 1.0 se décline en trois tailles différentes : Nano, qui est optimisé pour les appareils mobiles et les développeurs d'applications ; Pro, qui est le modèle par défaut conçu pour un large éventail de tâches et de clients ; et Ultra, le modèle d'IA le plus sophistiqué que Google dit avoir jamais construit et qui fait encore l'objet de tests de sécurité.
Le lancement de mercredi visait également à présenter les avancées de Google dans le domaine de l'informatique en nuage, une ressource essentielle pour les développeurs d'IA. L'entreprise a déclaré avoir formé Gemini à l'aide d'une nouvelle génération de processeurs puissants basés sur l'informatique en nuage, capables de former collectivement de grands modèles d'IA près de trois fois plus rapidement que la version précédente. Cette technologie, qui sera également mise à la disposition des clients de Google, pourrait donner un coup de fouet au secteur de l'IA en général, en rendant la formation à l'IA plus accessible et en renforçant la troisième place de Google sur le marché des services d'informatique dématérialisée. Toutefois, on ne sait pas exactement comment les puces d'IA de Google se situent par rapport à celles des principaux fabricants de puces tels que Nvidia.
Lors des tests, le modèle Gemini de Google a surpassé les modèles d'IA concurrents sur plus de deux douzaines de points de référence couramment utilisés par les chercheurs en IA pour évaluer la compréhension de la lecture, les capacités mathématiques et les capacités de raisonnement à plusieurs étapes d'un algorithme, a déclaré l'entreprise.
"Nous pensons qu'il ouvre de nouvelles frontières dans tous les domaines", a déclaré Eli Collins, vice-président des produits chez Google DeepMind, lors d'une conférence téléphonique mardi.
Il a toutefois semblé reconnaître le risque persistant que les modèles d'IA fournissent aux utilisateurs des résultats trompeurs, faisant allusion aux préoccupations des groupes de la société civile, des décideurs politiques et des chercheurs en IA.
Google a fait "beaucoup de travail pour améliorer l'exactitude des faits dans Gemini", a déclaré M. Collins, mais les grands modèles de langage "sont encore capables d'halluciner", un terme utilisé par les chercheurs en IA lorsque les systèmes d'IA inventent des faits et se trompent, mais avec une confiance extrême.
"Lorsque nous intégrons ces modèles dans des produits comme Bard, nous disposons de techniques supplémentaires pour améliorer la précision des réponses", a-t-il ajouté.
Conscient de ces risques, Google a déclaré mercredi que Gemini Ultra, la version la plus avancée du modèle, ne sera diffusée que progressivement à "certains clients, développeurs, partenaires et experts en matière de sécurité et de responsabilité pour une expérimentation précoce et un retour d'information, avant d'être mise à la disposition des développeurs et des entreprises clientes au début de l'année prochaine".
Gemini Ultra fait actuellement l'objet d'évaluations de sécurité par des tiers, également connues sous le nom de "red-teaming", conformément à l'engagement qu' elle a pris auprès de l'administration Biden au début de l'été.
Clare Duffy, de CNN, a contribué à ce rapport.
Lire aussi:
- Telefónica vise le lancement commercial de la téléphonie par hologramme
- vzbv : Les groupes Internet continuent à tricher malgré l'interdiction
- Telefónica vise un lancement commercial de la téléphonie par hologramme en 2026
- L'écobilan des systèmes informatiques de la Confédération ne s'est guère amélioré
Source: edition.cnn.com