Sprachmodell Gemini - Google hofft, mit neuem KI-Modell die Konkurrenz zu überholen
Im Wettlauf um künstliche Intelligenz will Google mit seinem neuen Sprachmodell Gemini die Führung übernehmen. Das KI-System muss mit dem GPT4-Sprachmodell des Konkurrenten OpenAI nicht nur mithalten, sondern es sogar übertreffen.
Sundar Pichai, CEO von Google, kommentierte die Gemini-Ankündigung und sagte, dass die Transformation, die die KI durchläuft, „die tiefgreifendste Transformation in unserem Leben sein wird und alles, was zuvor im mobilen Bereich oder im transformierten Internet stattgefunden hat, bei weitem übertrifft.“
Zwillinge kategorisieren Gesten und Zeichnungen
Zwillinge können nicht nur Texte in einem Chatbot generieren, sondern auch spezifische Probleme lösen und situationsbedingt Entscheidungen treffen. Es können auch Informationen aus Fotos und Videos aufgezeichnet werden. Google demonstrierte das System per Video-Chat und Gemini erkannte und ordnete das menschliche Äquivalent von Zeichnungen und Gesten sofort richtig ein.
Demis Hassabis, Chef von Google DeepMind, kündigte an: „Wir werden Gemini über Google-Produkte Milliarden von Menschen zugänglich machen.“ Die Google-Tochtergesellschaft wurde im April 2023 von einem 2014 übernommenen britischen Startup gegründet. Das Unternehmen besteht aus DeepMind und Googles internem Unternehmen Geheimdienstabteilung. Durch die Integration des bisher weitgehend unabhängig agierenden Startups hofft Pichai, die Bemühungen um künstliche Intelligenz innerhalb des Google-Konzerns zu zentralisieren, um stärker mit OpenAI konkurrieren zu können.
Drei Dimensionen der Planung
Google wird das neue System in drei verschiedenen Dimensionen auf den Markt bringen: Gemini Ultra, Gemini Pro und Gemini Nano. Gemini Ultra ist das größte und leistungsstärkste Modell, das für hochkomplexe Aufgaben geeignet ist. Diese Variante richtet sich hauptsächlich an Unternehmenskunden.
Gemini Pro richtet sich an ein breites Publikum und bringt beispielsweise dem Chatbot Google Bard „fortgeschrittenes Denken, Planen, Verstehen und mehr“ bei. „Dies ist Bards größtes Upgrade seit dem Start“, sagte Hassabis. Bard ist mittlerweile in mehr als 170 Ländern und Territorien auf Englisch verfügbar. Allerdings plant Google, in naher Zukunft neue Sprachen und Standorte zu unterstützen.
Gemini soll auch auf Google-Smartphones laufen
Die dritte Gemini-Variante, das Nano, bringt das System auf die Topmodelle der Google Pixel-Smartphones. „Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft“, kündigte Hassabis an. Beispielsweise kann man mit einer Diktiergerät-App nicht nur gesprochene Worte bei längeren Besprechungen, Vorträgen oder Interviews aufzeichnen, sondern sie auch in Echtzeit in geschriebene Sprache umwandeln. Mit Hilfe von Gemini Nano kann Pixel ohne Zeitverzögerung kompakte Abstracts erstellen. In den kommenden Monaten wird Gemini in anderen Google-Produkten und -Diensten wie der Suche, Anzeigen und Chrome erscheinen.
Google entwickelt seit Jahren KI-basierte Anwendungen, steht nun aber unter Druck, mehr preiszugeben. Vor einem Jahr startete das Startup OpenAI mit der Vorstellung seines Chatbots ChatGPT einen neuen Wettbewerb im Bereich der künstlichen Intelligenz. Die Software hat für Aufsehen gesorgt, weil sie wie Menschen Sätze bilden kann. Es wird anhand großer Datenmengen trainiert und schätzt Wort für Wort ab, wie Sätze weitergehen. Dadurch besteht die Gefahr, völlig falsche Angaben zu machen.
Lesen Sie auch:
- Telefónica plant die Einführung eines holografischen Telefons
- vzbv: Internetkonzerne betrügen trotz Verbot weiter
- Telefónica will bis 2026 holografische Telefone auf den Markt bringen
- Die ökologische Bilanz der IT-Systeme des Bundes zeigt kaum Verbesserungen
Quelle: www.stern.de