Google führt Gemini ein, sein bisher fortschrittlichstes KI-Modell, um mit ChatGPT zu konkurrieren
Der Umfang von Googles Ambitionen spiegelte sich in der Ankündigung des Unternehmens wider, in der Gemini als das "größte und leistungsfähigste KI-Modell" des Unternehmens vorgestellt und eine "Gemini-Ära" ausgerufen wurde, die vorsieht, dass das Modell des Tech-Giganten in jeder Umgebung eingesetzt wird, von großen Unternehmen bis hin zu Verbrauchergeräten wie dem Google Pixel 8 Pro.
Im Gegensatz zu bestehenden KI-Modellen, die in der Regel nur eine Art von Benutzereingabe verarbeiten, wie z. B. ausschließlich Bilder oder Text, wurde Gemini so entwickelt, dass es "multimodal" ist, so Google. Das bedeutet, dass es Eingaben akzeptiert, die mehrere Arten von Medien umfassen, indem es Text, Bilder, Audio, Video und Programmiercode kombiniert.
"Diese neue Ära von Modellen stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben", so Google-CEO Sundar Pichai in einem Blogbeitrag.
Googles firmeneigener KI-Chatbot Bard wurde bereits mit einer Version des Gemini-Modells aufgerüstet, so das Unternehmen am Mittwoch. Es ist geplant, Gemini in weit verbreitete Produkte wie die Google-Suchmaschine und den Chrome-Webbrowser einzubauen, die von Milliarden von Menschen weltweit genutzt werden.
Die Ankündigung stellt einen Versuch dar, die Initiative zurückzuerobern, nachdem Google und andere Tech-Giganten vor einem Jahr offenbar von der plötzlichen und sehr populären Veröffentlichung von OpenAIs ChatGPT überrascht wurden, die ein branchenweites Gerangel um die schnelle Einführung generativer KI-Tools und eine weltweite Debatte über die Risiken und Vorteile von KI auslöste.
Es stellt auch einen Versuch dar, generative KI bis in die entlegensten Winkel des Google-Imperiums zu bringen. Gemini 1.0 gibt es in drei verschiedenen Größen, so das Unternehmen: Nano, das für mobile Geräte und App-Entwickler optimiert ist; Pro, das Standardmodell, das für eine breite Palette von Aufgaben und Kunden entwickelt wurde; und Ultra, das anspruchsvollste KI-Modell, das Google nach eigenen Angaben je gebaut hat und das sich noch in der Sicherheitsprüfung befindet.
Die Vorstellung am Mittwoch war auch dazu gedacht, Googles Fortschritte im Cloud Computing zu präsentieren, einer wichtigen Ressource für KI-Entwickler. Das Unternehmen erklärte, es habe Gemini mit einer neuen Generation leistungsstarker Cloud-basierter Prozessoren trainiert, die gemeinsam große KI-Modelle fast dreimal so schnell trainieren können wie die Vorgängerversion. Diese Technologie, die auch den Cloud-Kunden von Google zur Verfügung gestellt wird, könnte der KI-Branche insgesamt einen bedeutenden Schub geben, indem sie das KI-Training zugänglicher macht und Googles drittplatzierte Position auf dem Markt für öffentliche Cloud-Dienste stärkt. Es ist jedoch unklar, wie Googles KI-Chips im Vergleich zu denen führender Chiphersteller wie Nvidia abschneiden.
In seinen Tests übertraf Googles Gemini-Modell die konkurrierenden KI-Modelle in mehr als zwei Dutzend Benchmarks, die von KI-Forschern üblicherweise verwendet werden, um das Leseverständnis, die mathematischen Fähigkeiten und die mehrstufigen Schlussfolgerungen eines Algorithmus zu bewerten, so das Unternehmen.
"Wir sehen, dass es in allen Bereichen neue Grenzen setzt", sagte Eli Collins, Vizepräsident der Produktabteilung von Google DeepMind, am Dienstag auf einer Telefonkonferenz gegenüber Reportern.
Er schien jedoch das Risiko einzuräumen, dass KI-Modelle den Nutzern irreführende Ergebnisse liefern, und spielte damit auf die Bedenken von Gruppen der Zivilgesellschaft, politischen Entscheidungsträgern und KI-Forschern an.
Google hat "eine Menge Arbeit geleistet, um die Faktizität in Gemini zu verbessern", sagte Collins, aber große Sprachmodelle "sind immer noch in der Lage zu halluzinieren", ein Begriff, den KI-Forscher verwenden, wenn KI-Systeme Fakten erfinden und Dinge falsch verstehen - aber mit extremer Sicherheit.
"Wenn wir diese Modelle in Produkte wie Bard integrieren, haben wir zusätzliche Techniken, um die Genauigkeit der Antworten zu verbessern", fügte er hinzu.
In Anerkennung dieser Risiken sagte Google am Mittwoch, dass Gemini Ultra, seine fortschrittlichste Version des Modells, nur schrittweise für "ausgewählte Kunden, Entwickler, Partner und Sicherheits- und Verantwortungsexperten für frühe Experimente und Feedback freigegeben wird, bevor es Anfang nächsten Jahres für Entwickler und Unternehmenskunden eingeführt wird."
Gemini Ultra durchläuft derzeit Sicherheitsbewertungen durch Dritte, auch bekannt als "Red-Teaming", in Übereinstimmung mit einer Verpflichtung, die das Unternehmen gegenüber der Biden-Administration im Sommer dieses Jahres eingegangen ist.
Clare Duffy von CNN hat zu diesem Bericht beigetragen.
Lesen Sie auch:
- Telefónica plant die Einführung eines holografischen Telefons
- vzbv: Internetkonzerne betrügen trotz Verbot weiter
- Telefónica will bis 2026 holografische Telefone auf den Markt bringen
- Die ökologische Bilanz der IT-Systeme des Bundes zeigt kaum Verbesserungen
Quelle: edition.cnn.com