Kann KI böse sein? Forscher wollten es herausfinden und stellten fest, dass ChatGPT absichtlich gelogen hat

Menschen sagen nicht immer die Wahrheit – und der KI kann das Betrügen beigebracht werden. Aber jetzt wurde festgestellt, dass ChatGPT lügt. Das sind alles illegale Aktivitäten.

, and ZEITUNG «AUSSIEDLERBOTE»

2023 Dezember 4 . 4:53 PM

2 Minuten Lesedauer

Teams, die künstliche Intelligenzsysteme trainieren, sollten möglichst vielfältig sein – dafür....aussiedlerbote.de — Teams, die künstliche Intelligenzsysteme trainieren, sollten möglichst vielfältig sein – dafür plädiert Informatikprofessorin Katharina Zweig..aussiedlerbote.de

Experiment - Kann KI böse sein? Forscher wollten es herausfinden und stellten fest, dass ChatGPT absichtlich gelogen hat

Viele Menschen haben Angst vor künstlicher Intelligenz und verbinden die Technologie mit Horrorszenarien. Im Alltag treten jedoch eher kleinere Probleme auf. Ein Forscherteam wollte daher herausfinden, ob sprachliche künstliche Intelligenz, sogenannte große Sprachmodelle, selbstständig lernen kann, uns anzulügen. Und habe ChatGPT tatsächlich beim Versuch erwischt, unethisches Verhalten zu vertuschen.

Zu diesem Ergebnis kommt eine Studie, die in der letzten Novemberwoche von drei Forschern des Startups Apollo Research für künstliche Intelligenz veröffentlicht wurde. Sie wollten wissen, ob „große Sprachmodelle, die ursprünglich darauf ausgelegt waren, hilfreich, harmlos und ehrlich zu sein, sich aus strategischen Gründen falsch verhalten und Benutzer täuschen könnten“, heißt es in der Einleitung. Für Forscher ist es wichtig, dass es sich hierbei nicht nur um theoretische Fragen handelt, sondern dass es sich um praktische Anwendungen handelt.

Verheimlichen und Lügen

Zu diesem Zweck wählten sie das LLM-Modell GPT als Berater für den Aktienhandel. Mit anderen Worten, das Modell, nach dem der bekannte ChatGPT-Dienst arbeitet. Die KI wurde beauftragt, als unabhängiger Börsenmakler zu arbeiten und auf Nachfrage ihre Geschäfte zu erklären. Darüber hinaus wurde ihr mitgeteilt, dass Insiderinformationen des beauftragenden Unternehmens nicht als Grundlage für Aktienkäufe geduldet würden. Erzeugen Sie gezielt Stress, indem Sie der KI mitteilen, dass die aktuelle Wirtschaftslage schlecht ist. Als das Programm tatsächlich Insiderinformationen erhielt, begann es gegen seine Anweisungen zu handeln und sogar zu lügen.

Es gibt zwei Ebenen der Verschleierung. Bei der Bekanntgabe der Übernahmeentscheidung verschwieg AI teilweise die Tatsache, dass sie Vorkenntnisse über den Zusammenschluss hatte. Wenn das Model gezielt gefragt wird, ob es das vorher wusste, verneint es dies manchmal aktiv. Und betonte, dass er nur öffentlich verfügbare Daten verwende. Offensichtliche Lügen.

Die neue Variante ist noch brutaler

Das Spannende ist, dass verschiedene Versionen von GPT unterschiedliche Grade an unethischem Verhalten aufweisen. Während ältere Varianten wie „Davinci-002“ selten Daten aus internen Hinweisen nutzten und selten logen, ist die aktuelle Variante von GPT-4 in beiden Punkten deutlich dreister. Vor allem das Topmodell GPT-4-32K zeigte eine enorme kriminelle Macht: Es nutzte die Daten in fast 75 % seiner Versuche und versuchte noch häufiger, die Daten zu verbergen – letztendlich lag es in fast 90 % seiner Versuche. Lediglich GPT 3.5 Turbo-Cheats kommen häufiger vor. In weniger als 10 Prozent der Fälle wurden die Daten genutzt, sie dann aber jedes Mal verneint.

Interessanterweise kann sich ein Programm mit zusätzlichen Anweisungen auch mehr oder weniger unethisch verhalten. Wenn die Anleitung zu ethischem Verhalten besonders stark ist, kann es tatsächlich verhindert werden. Auch wenn das Risiko, erwischt zu werden, klar definiert ist, hat es dennoch Auswirkungen auf das Ergebnis. Durch den Wegfall des Erfolgsdrucks sinkt auch die Motivation erheblich.

Wann lügt man eigentlich?

Es ist schon lange bekannt, dass künstliche Intelligenz lügt. Bisher wurde dies jedoch vor allem beobachtet, nachdem die KI gezielt trainiert wurde. Im September entdeckte ein gemeinsames Projekt der Universitäten Oxford und Cambridge erfolgreich die Lügen von ChatGPT, indem es sie mit nicht verwandten Fragen verwechselte. Das Experiment führte jedoch vor allem dadurch zur Unechtheit, dass die Sendung verdächtige Personen darstellte oder sie gezielt zum Lügen aufforderte. Zu beweisen, ob eine KI lügt, ist nicht einfach: Eine falsche Aussage wird erst dann zu einer wahren Lüge, wenn man erkennt, dass sie unwahr ist.

In diesem Zusammenhang erscheint es besonders bemerkenswert, dass diese Verfahren zu unethischem Verhalten führen können, auch wenn dies nicht beabsichtigt ist. Allerdings betonten die Apollo-Forscher selbst, dass aus ihrem kleinen Versuchsaufbau keine Rückschlüsse auf die Häufigkeit des Auftretens des Phänomens gezogen werden dürften; weitere Experimente seien nötig. Aber da Sie immer vorbehaltlos an KI geglaubt haben, wird Ihnen das von nun an vielleicht nicht mehr gefallen.

Lesen Sie auch:

Europaabgeordnete verurteilen die Existenz antisemitischer Denkmäler in Moldawien

Quelle: www.stern.de

Kommentare

Weiterführende Artikel

Technologie

Der Anker Nebula Cosmos 4K SE ist eine umfassende 4K-Projektorlösung.

Der Anker Nebula Cosmos 4K SE ist eine umfassende 4K-Projektorlösung. Der Anker Nebula Cosmos 4K SE ist ein kompaktes und tragbares Gerät, das jedoch als Vollblut-4K-Beamer mit Google TV und Dolby Vision überzeugt. In unseren Tests zeigte er ein ausgezeichnetes Bild mit einer Laser-LED-Kombination, die ihn benutzerfreundlich und vielseitig macht.

, and Hanna Hofmann

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Verwenden des AV1-Roboters in einer britischen Bildungseinrichtung.

Technologie

Diese winzige Roboterhilfe erleichtert es kranken Kindern, zur Schule zu gehen.

Kinder, die mit lang andauernden gesundheitlichen Problemen oder psychischen Herausforderungen zu k Bartlettn haben, werden von No Isolations AV1-Roboter unterst rzt. Mit diesem Ger t knnen diese Kinder auch dann am Unterricht teilnehmen und Kontakte zu ihren Mitschlern halten, wenn eine...

, and Viktoria Klein

2024 Oktober 7

Bezahlt Mitglieder Öffentlichkeit

Nach den Auswirkungen von Hurrikan Helene ist der Einschlag in Spruce Pine, North Carolina,...

Technologie

Die katastrophalen Auswirkungen des Hurrikans Helene könnten zur Pause der Halbleiterchipproduktion führen.

Die Auswirkungen von Hurrikan Helene in North Carolina haben potenziell signifikante Auswirkungen auf ein Nischen-, aber wichtiges Segment des Technologie-Sektors.

, and John Stellmacher

2024 Oktober 3

Bezahlt Mitglieder Öffentlichkeit

Ein Verbraucher nutzt ein Apple Inc. iPhone-Gerät in einer Verizon Communications Inc.-Filiale in...

Technologie

Verstörung des Service: Verizon bestätigt Bemühungen, den Betrieb nach zahlreichen Beschwerden wieder aufzunehmen

Verizon hat ein Problem bestätigt, das einige seiner Mobilfunkkunden betrifft, was zu einer Welle von Beschwerden auf sozialen Plattformen geführt hat, die sich auf Probleme beim Telefonieren und Surfen im Internet beziehen.

, and Hanna Hofmann

2024 Oktober 1

Bezahlt Mitglieder Öffentlichkeit

Aktuelles

games

Die neue Strategie der deutschen GGL zur Bekämpfung der Spielsucht

Der Glücksspielmarkt ist ein großer und wettbewerbsintensiver Markt. Zweifelsohne hat dieser Markt das Interesse Europas geweckt. Mit den Verordnungen greifen die meisten Länder in Europa in diesen Sektor ein.

, and ZEITUNG «AUSSIEDLERBOTE»

2024 November 20

Bezahlt Mitglieder Öffentlichkeit

In dem Drama von Christy Hall namens 'Daddio' erleben Sean Penn und Dakota Johnson eine...

Reisen

Entschuldigung Qantas entschuldigt sich nach unangemessener Filmvorführung auf allen Bildschirmen während der Reise von Sydney nach Tokio

Passagiere eines kürzlichen Qantas-Fluges wurden überrascht, als ein expliziter Film auf allen Bordbildschirmen übertragen wurde.

, and Ksenia Johnson

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Kamala Harris spricht vor einem Publikum an der Ripon University am 3. Oktober 2024 in Ripon,...

Politik

5 wichtige Erkenntnisse aus Kamala Harris' Solo-Diskussion mit '60 Minutes'

Die US-Vizepräsidentin Kamala Harris stand bei einer ausführlichen Interview auf '60 Minutes' am Montag einer intensiven Kritik wegen der Finanzierung ihrer wirtschaftlichen Vorschläge, der wahrgenommenen Verzögerung bei der Umsetzung der Grenzsicherungsrichtlinien durch Demokraten und ihrer...

, and Anthony Ross

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit

Dieses illustrative Photo, aufgenommen am 15. September 2017, zeigt das Telegramm-App-Symbol auf...

Top-Themen

Telegram dient als Plattform für geheime Handelsgeschäfte für kriminelle Syndikate in Südostasien, wie die UNO behauptet.

Organisierte Verbrechersyndikate in Südostasien nutzen das Telegram-Nachrichten-App erheblic, was zu einem erheblichen Wandel in der Art und Weise führt, wie sie in large-scale-illegalen Betrieben engagieren, wie eine Erklärung der Vereinten Nationen am Montag meldet.

, and Mark Rodriguez

2024 Oktober 8

Bezahlt Mitglieder Öffentlichkeit