Fortgeschrittene Gespräche kommen auf ChatGPT

OpenAI hat Benutzer beeindruckt, als es Mitte dieses Jahres eine verbesserte Sprachfunktion für die fortschrittlichste Version von ChatGPT gezeigt hat.

, and Michael Bootcampf

2024 Juli 30 . 8:41 PM

2 Minuten Lesedauer

Mit erweiterter Spracherkennung können ChatGPT-Nutzer natürliche, Echtzeit-Sprachgespräche mit dem... — Mit erweiterter Spracherkennung können ChatGPT-Nutzer natürliche, Echtzeit-Sprachgespräche mit dem Chatbot führen

Fortgeschrittene Gespräche kommen auf ChatGPT

Fernab vom typischen robotergleichen Ton, den man von digitalen Assistenten wie Alexa oder Siri kennt, klingt der ChatGPT-4o-Advanced Voice Mode erstaunlich menschlich. Er reagiert in Echtzeit, kann Unterbrechungen ausgleichen, lacht bei Witzen mit und kann den emotionalen Zustand eines Sprechers anhand seiner Stimmlage einschätzen. (In der ersten Demonstration klang es verdächtig nach Scarlett Johansson).

Ab Dienstag beginnt die Ausrollung des Advanced Voice Mode - der mit der leistungsstarken Version des Chatbots, ChatGPT-4o, funktioniert - für zahlende Nutzer. Der Advanced Voice Mode wird zunächst einer kleinen Gruppe von Abonnenten des "Plus"-Modus zur Verfügung gestellt und soll bis zum Herbst für alle Plus-Nutzer verfügbar sein.

ChatGPT verfügt bereits über eine weniger fortschrittliche Sprachmodus. Doch die Einführung eines fortgeschritteneren Voice Mode könnte einen Wendepunkt für OpenAI darstellen und den Chatbot in eine Art virtuellen, persönlichen Assistenten verwandeln, mit dem Nutzer auf natürliche, mündliche Weise sprechen können, wie sie es mit einem Freund tun würden. Die Leichtigkeit des Sprechens mit dem Advanced Voice Mode von ChatGPT könnte dazu beitragen, dass Nutzer das Tool häufiger verwenden, und eine Herausforderung für etablierte virtuelle Assistenten wie Apple und Amazon darstellen.

Doch die Einführung eines fortgeschritteneren Voice Mode für ChatGPT wirft auch große Fragen auf: Wird das Tool zuverlässig verstehen, was die Nutzer sagen, selbst wenn sie sprachliche Unterschiede aufweisen? Und werden Nutzer geneigt sein, einem menschenähnlich klingenden AI-Assistenten blind zu vertrauen, selbst wenn er sich irrt?

OpenAI hatte initially geplant, den Advanced Voice Mode im Juni einzuführen, sagte jedoch, dass es "einen Monat mehr Zeit braucht, um unsere Lancierungsgrenze zu erreichen", um die Sicherheit des Tools zu testen und sicherzustellen, dass es von Millionen von Menschen verwendet werden kann, während es immer noch Echtzeit-Antworten liefert.

Das Unternehmen sagte, dass es das AI-Modell in den letzten Monaten mit mehr als 100 Testern getestet hat, um mögliche Schwächen zu identifizieren, "die insgesamt 45 verschiedene Sprachen sprechen und aus 29 verschiedenen geografischen Regionen stammen", wie es in einer Mitteilung am Dienstag heißt.

Unter den Sicherheitsmaßnahmen wird der Voice Mode nicht in der Lage sein, Stimmen jenseits von vier vordefinierten Optionen zu verwenden, die in Zusammenarbeit mit Sprechern erstellt wurden - um Verwechslungen zu vermeiden - und wird bestimmte Anfragen blockieren, die Musik oder andere urheberrechtlich geschützte Audios erzeugen sollen. OpenAI sagt, dass das Tool auch die gleichen Schutzmechanismen wie der Textmodus von ChatGPT haben wird, um zu verhindern, dass es illegalen oder "schädlichen" Inhalt generiert.

Der Advanced Voice Mode wird auch einen wichtigen Unterschied zum Demo aufweisen, das OpenAI im Mai gezeigt hat: Nutzer werden nicht mehr auf die Stimme zugreifen können, von der viele (einschließlich der Schauspielerin selbst) glaubten, dass sie wie Johansson klingt. Während OpenAI betont hat, dass die Stimme nie so klingen sollte wie Johansson und mit Hilfe eines anderen Schauspielers erstellt wurde, setzte man die Verwendung der Stimme "aus Respekt" aus, nachdem die Schauspielerin Beschwerde eingelegt hatte.

Die Einführung des Advanced Voice Mode von ChatGPT folgt auf die Ankündigung von OpenAI letzte Woche, dass es einen Suchmaschinen-Test durchführt, der seine AI-Technologie nutzt, während das Unternehmen sein Portfolio an Consumer-facing AI-Tools weiter ausbaut. Die OpenAI-Suchmaschine könnte schließlich eine ernsthafte Wettbewerbsbedrohung für die Dominanz von Google in der Online-Suche darstellen.

Die Ausrollung des Advanced Voice Mode von ChatGPT-4 könnte mehr Geschäft für OpenAI bringen, indem sie den Chatbot in einen virtuellen Assistenten für natürliche Gespräche verwandelt. Doch die Zuverlässigkeit des Verstehens von Nutzer-Sprech mit Unterschieden und das Vertrauen in einen AI-Assistenten, der Fehler macht, sind Significant Bedenken.

Lesen Sie auch:

Kommentare

Weiterführende Artikel

Technologie

Der Anker Nebula Cosmos 4K SE ist eine umfassende 4K-Projektorlösung.

Der Anker Nebula Cosmos 4K SE ist eine umfassende 4K-Projektorlösung. Der Anker Nebula Cosmos 4K SE ist ein kompaktes und tragbares Gerät, das jedoch als Vollblut-4K-Beamer mit Google TV und Dolby Vision überzeugt. In unseren Tests zeigte er ein ausgezeichnetes Bild mit einer Laser-LED-Kombination, die ihn benutzerfreundlich und vielseitig macht.

, and Hanna Hofmann

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Verwenden des AV1-Roboters in einer britischen Bildungseinrichtung.

Technologie

Diese winzige Roboterhilfe erleichtert es kranken Kindern, zur Schule zu gehen.

Kinder, die mit lang andauernden gesundheitlichen Problemen oder psychischen Herausforderungen zu k Bartlettn haben, werden von No Isolations AV1-Roboter unterst rzt. Mit diesem Ger t knnen diese Kinder auch dann am Unterricht teilnehmen und Kontakte zu ihren Mitschlern halten, wenn eine...

, and Viktoria Klein

2024 Oktober 7

Bezahlt Mitglieder Öffentlichkeit

Nach den Auswirkungen von Hurrikan Helene ist der Einschlag in Spruce Pine, North Carolina,...

Technologie

Die katastrophalen Auswirkungen des Hurrikans Helene könnten zur Pause der Halbleiterchipproduktion führen.

Die Auswirkungen von Hurrikan Helene in North Carolina haben potenziell signifikante Auswirkungen auf ein Nischen-, aber wichtiges Segment des Technologie-Sektors.

, and John Stellmacher

2024 Oktober 3

Bezahlt Mitglieder Öffentlichkeit

Ein Verbraucher nutzt ein Apple Inc. iPhone-Gerät in einer Verizon Communications Inc.-Filiale in...

Technologie

Verstörung des Service: Verizon bestätigt Bemühungen, den Betrieb nach zahlreichen Beschwerden wieder aufzunehmen

Verizon hat ein Problem bestätigt, das einige seiner Mobilfunkkunden betrifft, was zu einer Welle von Beschwerden auf sozialen Plattformen geführt hat, die sich auf Probleme beim Telefonieren und Surfen im Internet beziehen.

, and Hanna Hofmann

2024 Oktober 1

Bezahlt Mitglieder Öffentlichkeit

Aktuelles

games

Die neue Strategie der deutschen GGL zur Bekämpfung der Spielsucht

Der Glücksspielmarkt ist ein großer und wettbewerbsintensiver Markt. Zweifelsohne hat dieser Markt das Interesse Europas geweckt. Mit den Verordnungen greifen die meisten Länder in Europa in diesen Sektor ein.

, and ZEITUNG «AUSSIEDLERBOTE»

2024 November 20

Bezahlt Mitglieder Öffentlichkeit

In dem Drama von Christy Hall namens 'Daddio' erleben Sean Penn und Dakota Johnson eine...

Reisen

Entschuldigung Qantas entschuldigt sich nach unangemessener Filmvorführung auf allen Bildschirmen während der Reise von Sydney nach Tokio

Passagiere eines kürzlichen Qantas-Fluges wurden überrascht, als ein expliziter Film auf allen Bordbildschirmen übertragen wurde.

, and Ksenia Johnson

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Kamala Harris spricht vor einem Publikum an der Ripon University am 3. Oktober 2024 in Ripon,...

Politik

5 wichtige Erkenntnisse aus Kamala Harris' Solo-Diskussion mit '60 Minutes'

Die US-Vizepräsidentin Kamala Harris stand bei einer ausführlichen Interview auf '60 Minutes' am Montag einer intensiven Kritik wegen der Finanzierung ihrer wirtschaftlichen Vorschläge, der wahrgenommenen Verzögerung bei der Umsetzung der Grenzsicherungsrichtlinien durch Demokraten und ihrer...

, and Anthony Ross

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Dieses illustrative Photo, aufgenommen am 15. September 2017, zeigt das Telegramm-App-Symbol auf...

Top-Themen

Telegram dient als Plattform für geheime Handelsgeschäfte für kriminelle Syndikate in Südostasien, wie die UNO behauptet.

Organisierte Verbrechersyndikate in Südostasien nutzen das Telegram-Nachrichten-App erheblic, was zu einem erheblichen Wandel in der Art und Weise führt, wie sie in large-scale-illegalen Betrieben engagieren, wie eine Erklärung der Vereinten Nationen am Montag meldet.

, and Mark Rodriguez

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit