zum Inhalt

Das ChatGPT-Modell von OpenAI erkennt Emotionen und singt Lieder

Doch keine Suchmaschine

ChatGPT kann jetzt Informationen von einer Smartphone-Kamera gleichzeitig mit gesprochenen Befehlen...
ChatGPT kann jetzt Informationen von einer Smartphone-Kamera gleichzeitig mit gesprochenen Befehlen verarbeiten.

Das ChatGPT-Modell von OpenAI erkennt Emotionen und singt Lieder

OpenAI, der Entwickler von ChatGPT, bringt ein neues KI-Modell namens GPT-4o auf den Markt. Das Modell verfügt über einige beeindruckende Funktionen, darunter eine Unterhaltung im Hollywood-Stil mit natürlicher Stimme und kurzer Reaktionszeit. Mit diesen Fähigkeiten ist es keine Überraschung, dass ChatGPT zu einem ernstzunehmenden Konkurrenten für große Sprachassistenten wie Amazon Alexa und Apples Siri wird.

Der neue GPT-4o kann jetzt beim Sprechen Emotionen fühlen und ausdrücken und bietet damit ein Erlebnis, das den fortschrittlichen Sprachassistenten Hollywoods ähnelt. OpenAI plant, diese Funktion allen Nutzern zur Verfügung zu stellen - kostenlos. Es bleibt jedoch abzuwarten, inwieweit ChatGPT in der Lage sein wird, sich fließend in Sprachen wie Deutsch zu unterhalten.

Frühere Versionen von ChatGPT mussten Pausen einlegen, um Benutzereingaben zu verarbeiten, aber GPT-4o bietet ein viel flüssigeres Erlebnis. Es kann komplexe Emotionen erfassen, nahtlos zwischen Englisch und Italienisch übersetzen und mit Leichtigkeit Ratschläge zu Aufgaben geben. Mit diesen Fortschritten ist ChatGPT anderen Sprachassistenten auf dem Markt einen deutlichen Schritt voraus. Medien berichten sogar, dass Apple in Gesprächen mit OpenAI ist, um dessen Technologie in seine Software zu integrieren.

Apropos Fortschritte: ChatGPT ist nun in der Lage, neben gesprochenen Befehlen auch Informationen von der Smartphone-Kamera zu verarbeiten. In einer Präsentation wurde gezeigt, wie ChatGPT bei einer mathematischen Gleichung helfen kann. Die KI konnte in Echtzeit Ratschläge geben, während sie die Gleichung vervollständigte, was ein hohes Maß an Multitasking demonstrierte. Eine anfängliche Panne führte dazu, dass die KI behauptete, die Aufgabe zu sehen, bevor die Gleichung angezeigt wurde, aber sie korrigierte den Fehler schnell mit einem bescheidenen "Ups, ich war zu aufgeregt".

ChatGPT kann nun auch Emotionen erkennen, indem es die Mimik der Nutzer beobachtet, wie in einer Live-Demo gezeigt wurde, in der ein lächelnder Mitarbeiter darum bat, seine Stimmung zu erkennen. Dieses Feature funktioniert neben anderen Funktionen wie der Änderung des Sprachstils und des Gesangs, die sicher für Unterhaltung sorgen. Altman, CEO von OpenAI, lobte das neue Modell als eine fantastische Computererfahrung, die an Filme erinnere, in denen die KI anthropomorphe Persönlichkeitsmerkmale annimmt. Er zeigte sich auch erstaunt, dass die KI tatsächlich real ist.

ChatGPT hat derzeit eine riesige Nutzerbasis von über 100 Millionen - eine Zahl, die mit der Veröffentlichung von GPT-4o wahrscheinlich weiter wachsen wird. Und während kommerzielle Nutzer noch mehr Leistung aus dem Modell herausholen können, will OpenAI das Erlebnis für die Mehrheit kostenlos halten.

Die Ankündigung ist umso interessanter, als am Dienstag die jährliche Entwicklerkonferenz von Google stattfindet, auf der auch KI-Entwicklungen auf der Tagesordnung stehen könnten. Kurz vor der Google I/O-Konferenz veröffentlichte der OpenAI-Konkurrent Anthropic die europäische Version seines KI-Assistenten Claude. Mit beeindruckenden Fähigkeiten in Sprachen wie Deutsch, Französisch und Italienisch entwickelt sich Claude zu einem beachtlichen Konkurrenten.

Es wurden Sicherheitsbedenken geäußert, dass KI-gestützte Übersetzungsfunktionen missbräuchlich eingesetzt werden könnten. Ein Beispiel dafür ist das Lesen von scheinbar einfacher Sprache, hinter der sich möglicherweise betrügerische Absichten verbergen können, wie z. B. Anrufe. OpenAIs Abonnement-Kunden werden mehr Zugang zu fortgeschrittenen Modellfunktionen erhalten, während die Preise für kommerzielle Nutzer erschwinglicher werden. Altman bemerkte: "Es wird viele Dinge geben, für die man Geld verlangen kann. Und das wird OpenAI helfen, Milliarden von Menschen kostenlos zu bedienen."

Mit diesen Fortschritten sieht die Zukunft der KI-gestützten Dienste rosig aus, und sowohl OpenAI als auch Anthropic rücken ins Rampenlicht.

Laut Kaplan ist es Anthropic gelungen, die Zahl der von seiner KI-Software erzeugten falschen Informationen oder "Halluzinationen" zu verringern. Diese "Halluzinationen" sind bei KI-Systemen aufgrund ihrer Natur üblich. Sie werden auf riesige Datenmengen trainiert und bestimmen jedes Wort eines Satzes auf der Grundlage seiner möglichen Fortsetzung. Leider kann dies zu völlig falschen Aussagen führen, selbst wenn die KI nur mit genauen Informationen gefüttert wurde. Um diese Fehler zu minimieren, hat Anthropic Claude entwickelt, das die generierten Sätze mit Fakten vergleicht und so Ungenauigkeiten eliminiert. Außerdem vergleicht es die formulierten Sätze mit grundlegenden Regeln, um Beleidigungen oder Diskriminierungen zu verhindern.

Lesen Sie auch:

Quelle: www.ntv.de

Kommentare

Aktuelles