"Erweiterter Sprachmodus" kommt auf ChatGPT Plus
Diese Woche hat OpenAI bekanntgegeben, dass es mit der Auslieferung des erweiterten Voice Mode für ChatGPT Plus-Nutzer begonnen hat. Auch wenn nicht alle Plus-Abonnenten die Funktion sofort sehen werden – OpenAI reserviert die erste Runde für einen kleinen Pool von Testern – wird das Unternehmen die Aktualisierung im Laufe der Zeit an mehr Nutzer ausliefern, was mehr zahlenden Kunden die Möglichkeit gibt, (vielleicht) die AI-Zukunft zu erleben, die uns die Filme versprochen haben.
Erweiterten Voice Mode verwandelt ChatGPT in Her
ChatGPT hatte bereits seit einiger Zeit einen Voice Mode, der es Nutzern ermöglicht, auf die gleiche Weise mit ChatGPT zu interagieren, wie sie es normalerweise über Text tun, aber indem sie ihre Anfragen laut sprechen; ChatGPT wird dann seine Antworten "sprechen". Der erweiterte Modus ist jedoch anders: Laut OpenAI ist diese großartigere Version des Sprach-Chats viel natürlicher und ermöglicht es Ihnen, in Echtzeit mit ChatGPT zu sprechen. Das Unternehmen sagt, dass Sie den Bot jederzeit unterbrechen können, um die Richtung des Gesprächs zu ändern, und er sollte in der Lage sein, den Ton Ihrer Stimme zu verstehen, anstatt nur den Inhalt Ihrer Fragen und Anforderungen. Wenn alles so funktioniert, wie angekündigt, sollte das Sprechen mit ChatGPT der bisher naheste kommende Versuch eines echten Lebensgesprächs mit einer AI sein.
Das Unternehmen stellte den erweiterten Voice Mode erstmals im Mai vor, indem es diese Fähigkeiten in einer Reihe von Live-Demos zeigte. Damals beworben wurde die "Sky"-Stimme, die bemerkenswert wie Scarlett Johansson klang und Vergleiche mit dem 2013er Film Her aufkommen ließ, in dem ein Mann sich in seine AI-Assistentin verliebt. Das Unternehmen pausierte die Verwendung dieser Stimme bald darauf aufgrund von Kritik, dass sie zu sehr wie Johansson klinge. OpenAI bestritt, die tatsächliche Stimme des Schauspielers zu verwenden, aber das Unternehmen wusste offensichtlich um die Ähnlichkeiten, wie aus CEO Sam Altmans Post auf X hervorgeht:
Dieser Tweet ist derzeit nicht verfügbar. Er wird möglicherweise geladen oder entfernt.Basierend auf den Demos versucht der Bot tatsächlich, Ihren Ton zu imitieren, und ermöglicht einige Echtzeit-Gespräche. Allerdings war die Demo nicht perfekt: Der Bot hörte abrupt auf zu sprechen, wenn er dachte, unterbrochen zu werden (selbst wenn er es nicht war), und der Ton seiner Antworten war manchmal etwas zu freundlich, fast flirtend. Wir werden sehen müssen, wie gut er tatsächlich funktioniert, jetzt wo er an tatsächliche Verbraucher ausgegeben wird.
Wie man ChatGPT's erweiterter Voice Mode ausprobiert
Um eine Chance zu haben, den erweiterten Voice Mode früher auszuprobieren, müssen Sie ein ChatGPT Plus-Abonnent sein. Voice Mode wird in Zukunft für kostenlose Nutzer verfügbar sein, aber diese erste Auslieferung ist nur für Kunden, die OpenAI $20 pro Monat bezahlen.
Allerdings garantiert das Bezahlen nicht den Zugang zur Alpha-Version des erweiterten Voice Mode. OpenAI rollt diese Funktion zunächst schrittweise aus, so dass der Zugang jetzt einfach vom Zufall abhängt. Wenn Sie jedoch Zugang erhalten, sollten Sie oben im ChatGPT-App ein neues Pop-up "Erweiterten Voice Mode ausprobieren" sehen. Tippen Sie darauf und Sie werden eine Nachricht sehen, die das Feature erklärt. Tippen Sie auf Weiter und Sie können jetzt in erweiterter Weise mit ChatGPT sprechen.
Die Ankündigung des erweiterten Voice Mode von ChatGPT hat Vergleiche mit dem 2013er Film 'Her' aufkommen lassen, da das verbesserte Sprachfeature initially bemerkenswert wie Scarlett Johansson klang. Seitdem hat OpenAI die Verwendung dieser Stimme aufgrund von Kritik pausiert.
Mit der Auslieferung des erweiterten Voice Mode an ChatGPT Plus-Nutzer haben nun mehr Personen die Möglichkeit, mit ChatGPT auf eine Weise zu interagieren, die ein echtes Lebensgespräch nachahmt, indem sie die Fähigkeit der AI nutzen, den Ton ihrer Stimme zu verstehen.