zum Inhalt

Alle Möglichkeiten, ein Bild mit KI zu machen

Lassen Sie sich nicht von der Interpretation der Welt durch künstliche Intelligenz hinters Licht führen.

Alle Möglichkeiten, ein Bild als von künstlicher Intelligenz erstellt zu erkennen
Alle Möglichkeiten, ein Bild als von künstlicher Intelligenz erstellt zu erkennen

Alle Möglichkeiten, ein Bild mit KI zu machen

Dieser Beitrag ist Teil der “AI-Enttarnt”-Serie von Lifehacker. Wir untersuchen sechs verschiedene Arten von künstlich erzeugten Medien und heben die gemeinsamen Macken, Nebenprodukte und Merkmale hervor, die helfen, zwischen künstlich und von Menschen erstellten Inhalten zu unterscheiden.

Künstliche Kunst ist kein bloßer Begriff mehr: Sie ist allgegenwärtig und Sie haben sie wahrscheinlich schon im Netzwerk encountered, ob Sie es wussten oder nicht. Künstliche Kunst hat Auszeichnungen gewonnen (obwohl es Kontroversen gab), in Netflix-Filmen verwendet (wiederum unter Kritik) und unzählige Facebook-Nutzer mit falschen Bildern von Babys, Jesus und Gemüse getäuscht. Es wird nicht so schnell wieder verschwinden.

Da sich die Technologie zur Bilderzeugung weiter verbessert, ist es wichtiger denn je, diese künstlich erzeugten Bilder zu erkennen, damit Sie nicht von jemandem anderem getäuscht werden. Es mag harmlos erscheinen, nicht zweimal über ein künstlich erzeugtes Bild von ein paar Enten nachzudenken, aber wenn schlechte Schauspieler Desinformation durch künstliche Bilder verbreiten, sind die Auswirkungen fatal. Unternehmen, die künstliche Bildgeneratoren herstellen, arbeiten an Methoden, um künstlich erzeugte Bilder zu „wasserzeichen“, aber wir sind noch nicht so weit. Die meisten künstlichen Kunstwerke im Netzwerk zirkulieren ohne eine klare Warnung für die Nutzer, dass die Bilder nicht echt sind. Bis dahin können diese Tipps helfen, diese gefälschten Bilder zu erkennen, wenn sie in Ihrem Feed auftauchen.

Wie künstliche Kunstgeneratoren funktionieren

Es ist einfach, sich ein künstliches Kunstwerk anzusehen und anzunehmen, dass der Generator, der es produziert hat, es einfach aus einer Reihe von Bildern in seiner Datenbank zusammengefügt hat. Das ist aber nicht wirklich das, was hier passiert.

Künstliche Kunstgeneratoren werden tatsächlich mit riesigen Datensätzen von Bildern von Kunst bis hin zu Fotografien trainiert. Diese Tools können diese Bilder jedoch nicht auf die gleiche Weise sehen wie Menschen. Stattdessen zerlegen sie diese Bilder Pixel für Pixel. Es wird kein Apfel sehen; es wird eine Gruppe von Pixeln und ihren Werten sehen. Mit der Zeit wird es lernen, dass diese Gruppierung dieser bestimmten Pixelwerte in der Regel ein Apfel ist. Trainieren Sie das AI mit genug Bildern mit genug Kontext, und es wird beginnen, Verbindungen zwischen allen Arten von Objekten und Stilen zu ziehen. Es wird lernen, wie man generally Obst, Tiere und Menschen sowie Kunststile, Farben und Stimmungen rendert.

Moderne künstliche Bildgeneratoren wie DALL-E verwenden das, was als Diffusion bekannt ist, um zu lernen und Bilder zu erzeugen. Im Grunde genommen nehmen sie ein Trainingsbild und fügen visuelles Rauschen (denken Sie an statisches Rauschen) zu dem Bild hinzu, bis das gesamte Bild bedeutungslos ist. Die Idee besteht darin, zu verstehen, wie das Bild durch das Hinzufügen von Rauschen an jedem Schritt beeinflusst wird: Von hier aus versuchen sie das Gegenteil und erstellen ihre eigene Version des ursprünglichen Bildes aus nichts außer Rauschen, was das AI trainiert, Bilder von Grund auf neu zu erstellen.

Alle Möglichkeiten, wie man erkennen kann, ob ein Bild mit künstlicher Intelligenz erstellt wurde

Prompt: "Generate an image of a group of friends smiling at each other while playing a board game."Credit: Jake Peterson/OpenAI

Dies ist eine sehr vereinfachte Erklärung, aber es ist wichtig zu wissen, dass diese Generatoren auf einer riesigen Datenbank von gelernten Beziehungen aufbauen. Das macht es möglich, komplexe Szenen in Sekundenschnelle zu rendern, aber es ist auch das, was zu den seltsamen Macken führt, die uns helfen können, ein künstliches Bild von einem echten zu identifizieren.

Zählen Sie die Finger

Künstliche Kunst wird immer besser, aber sie ist noch nicht perfekt. Während diese Tools in der Lage sind, hochwertige Bilder mit realistischem Licht zu erzeugen, kämpfen sie immer noch mit kleineren Details.

Vielleicht am bekanntesten ist, dass "menschliche" Subjekte in künstlicher Kunst die falsche Anzahl von Fingern haben. Vielleicht sieht der Rest des Bildes auf den ersten Blick überzeugend aus, aber schauen Sie auf die Hände und Sie werden sechs, sieben oder acht Finger an jeder Hand bemerken. Oder vielleicht ist es umgekehrt, und die Hand hat drei Finger, von denen zwei zu einem werden. Jedenfalls sind Finger und die Hände, an denen sie befestigt sind, oft durcheinandergebracht.

Aber während Finger das sind, wofür künstliche Intelligenz am bekanntesten ist, dass sie sie falsch macht, enden ihre Probleme nicht bei den Händen. Jede wiederkehrende Muster, insbesondere wenn es um Details mit Menschen geht, können mit künstlicher Kunst falsch generiert werden. Schauen Sie sich die Zähne eines Subjekts in einem Bild an: Manchmal gibt es viel zu viele oder sie sehen verzerrt aus, wie sie es normalerweise nie tun würden. Die meisten von uns haben keine perfekten Lächeln, aber künstliche Zähne sind auf einem anderen Niveau.

Sie könnten sogar ein Subjekt mit einem zusätzlichen Glied bemerken: Sie werden ein Bild anschauen und sich fragen, was daran nicht stimmt, als Sie plötzlich den dritten Arm des Subjekts aus seinem Sweatshirt kommen sehen.

Alle Arten, auf die ein Bild mit künstlicher Intelligenz erstellt wurde

Ask DALL-E to generate a map, and it does to some degree of accuracy, albeit with "AI writing."Credit: Jake Peterson/OpenAI

Vox hat ein großartiges Video, das erklärt, warum künstliche Intelligenz mit diesen wiederkehrenden Elementen kämpft, aber im Grunde genommen geht es darum, dass das AI nicht genug Erfahrung hat. Diese Tools werden mit einer riesigen Menge an Daten trainiert, aber wenn es um etwas Komplexes wie Hände geht, bietet die Daten, die es hat, nicht genug Kontext für das AI, um zu wissen, wie man das Element realistisch und richtig generieren soll. Es weiß nicht wie Hände tatsächlich funktionieren - es kann nur auf die Hände zurückgreifen, die es sieht. Hier erleben wir die Grenzen dieses Wissens.

Aber es geht nicht nur um die Themen: Alles im Bild ist für dieses Vermischen fair game. Schauen Sie sich das Bild an, das ich mit DALL-E unten erzeugt habe. Das Brettspiel ist wellig, mit Teilen des Spielbretts, die in andere Teile übergehen, und Figuren, die sich in die Kacheln einfügen. Die Zähne der Frau rechts werden alle zusammengequetscht, während die Ärmel der anderen Frau sich selbst falten. (Ganz zu schweigen davon, dass ihre Finger ineinander übergehen.)

Aufforderung: "Erzeuge ein Bild einer Gruppe von Freunden, die sich beim Spielen eines Brettspiels anlächeln."Credit: Jake Peterson/OpenAI## Schreibkritik

KI kann zwar Text generieren, aber sie kann oft nicht gut schreiben, wenn es um Bilder geht. In vielen Fällen sieht KI-Kunst, die Schreibelemente enthält, falsch aus. Manchmal sieht es aus wie ein Logo, das seinem realen Gegenstück ähnelt, aber es nicht ganz schafft. (Man kann erkennen, dass es versuchen soll, Coca-Cola zu sagen, aber alle Buchstaben werden durcheinandergebracht.) other times, it looks like someone trying to make up a language, or how it feels to try to read something in a dream. (In fact, a lot of these AI images give off a dream-like quality, at least to me.)

Now, this side of AI art is rapidly improving. Both DALL-E and Meta AI were able to generate an image of a cake that reads "HAPPY BIRTHDAY KAREN" without any horrendous issues. That said, Meta's wasn't perfect: The second "P" in "HAPPY" looked more like a "Y," while the "A" in "KAREN" had two lines through it rather than one. But it's important to note that these images come out better when you specifically prompt the AI to write them out: When left to its own devices, writing often looks odd, so if whoever created the image didn't think to fix it, it can be an obvious tell.

Ask DALL-E to generate a map, and it does to some degree of accuracy, albeit with "AI writing."Credit: Jake Peterson/OpenAI## Nach Dingen suchen, die einfach keinen Sinn ergeben

Alle Wege, um zu erkennen, dass ein Bild mit KI erstellt wurde

Prompt: "Generate an image of a basement party: People play beer bong, drink from red solo cups, and chat."Credit: Jake Peterson/OpenAI

Am Ende des Tages weiß KI-Kunst nichts wirklich. Sie produziert Kunst basierend auf den Beziehungen, die sie aus all ihren Trainingsdaten geschlossen hat. Es weiß nicht, wie ein Gebäude wirklich gebaut werden soll, wie Tennis gespielt wird oder wie sich eine menschliche Hand bewegt. Wenn man genau genug hinschaut, kann man diese knowledge gaps in der KI-Kunst sehen, insbesondere in Bildern, in denen viel los ist.

Nehmen Sie zum Beispiel dieses Bild: Ich bat DALL-E, ein Bild einer Kellerparty zu erzeugen, bei der Leute Beer Pong spielen, aus roten Solo-Bechern trinken und plaudern. Sofort gibt es einige große Probleme: Die Augen der Menschen im Bild sind mostly verkehrt; die Hand des Mannes, der Beer Pong spielt, ist durcheinander; und warum wirft er Tischtennisbälle von der Seite des Tisches? Sprechen wir vom Tisch, er ist wellig und verzieht sich auf eine Weise, wie ein echter Tisch es nicht tun würde, und es gibt zwei Sätze von Bechern auf einer Seite des Tisches aus irgendeinem Grund.

Schauen Sie in den Hintergrund, und es wird noch merkwürdiger. Ein Mann scheint auf den Knien zu sein und trinkt aus seinem roten Becher, als wäre es eine Flasche. Der Mann hinter ihm scheint eine blaue Dose in seinem roten Becher zu haben, als wäre der Becher ein Koozie. Die Person dahinter scheint ihr Gesicht auf Photoshopart zu haben, verschwommen wie das Subjekt ist.

Aufforderung: "Erzeuge ein Bild einer Kellerparty: Leute spielen Beer Pong, trinken aus roten Solo-Bechern und plaudern."Credit: Jake Peterson/OpenAIEven official examples from the companies that make these tools have these logical inconsistencies. OpenAI has a funny image of an avocado at therapist to show off DALL-E 3.

Credit: OpenAIThe avocado has a scooped-out pit, and is complaining to the therapist, who is a spoon, about feeling empty inside. It's a decent bit, but look at the therapist's notepad: They're writing on it backwards, with the pages facing out. DALL-E has seen enough therapist images to know what tools they usually write notes on, but doesn't understand we humans usually write on the paper, not the clipboard.

Of course, the AI posts that go viral on social media sites like Facebook often don't make sense at all. Who is building cat sculptures out of Oreos? Why are there so many sad artists making sandcastles of Jesus? Art can be imaginative, but AI art is particularly odd, in both the smaller details and the larger themes.

Alle Methoden, um zu zeigen, dass ein Bild mit KI erstellt wurde

Credit: OpenAI

AI-Glanz

Nach dem Betrachten von KI-Bildern für eine Weile fallen einem seltsamerweise Dinge auf, insbesondere bei den fotorealistischen Bildern: Alles ist glänzend. KI-Bilder haben oft, was einige "AI-Glanz" nennen, einen Glanz, der die Herkunft des Bildes verraten kann, wenn man weiß, wonach man suchen muss. Bilder sind oft überbelichtet oder haben dramatische Beleuchtung, was die Motive besonders hell macht.

Nach einer Weile schaut man auf ein Foto wie das unten und weiß sofort, dass es mit KI gemacht wurde, nur anhand des Aussehens. (Ganz zu schweigen davon, dass die Hände des Subjekts auch nicht stimmen.)

Während diese Tipps heute noch relevant sein mögen, entwickelt sich die KI-Technologie weiter und verbessert sich stetig, sodass sie in naher Zukunft möglicherweise nutzlos werden. KI ist bereits besser im Schreiben, wer sagt denn, dass sie nicht einen Weg finden wird, um realistische Hände jedes Mal zu erzeugen? Oder um Elemente in dem Foto davon abzuhalten, ineinander zu verlaufen? Oder um merkwürdige Dinge nicht mehr in den Hintergrund von Bildern einzufügen? Und während die obigen Tipps derzeit für fotorealistische Bilder nützlich sind, kann es schwieriger sein, Kunstwerke zu identifizieren, die von KI erstellt wurden: Diese können die gleichen Mängel wie oben beschrieben aufweisen, aber es ist einfacher, diese Unregelmäßigkeiten mit "Farben" zu kaschieren, die oft gemischt, weniger realistisch und offener für Interpretationen sind.

Da wir in ein besonders unruhiges Wahljahr gehen, ist es wichtiger denn je, Ihren Bullshit-Detektor zu aktivieren, wenn Sie durch das Internet surfen. Bevor Sie von jemandes detaillierter Kunst beeindruckt sind oder sich über ein beleidigendes Bild aufregen, denken Sie zweimal nach: Ist dieses Bild überhaupt real?

Obwohl die KI-Technologie Fortschritte gemacht hat, ist es immer noch möglich, KI-erzeugte Bilder durch Zeichen von Unvollkommenheit zu identifizieren. Ein solcher Hinweis ist der häufige Fehler bei der Darstellung von Fingern, der oft zu vielen oder falsch geformten Fingern führt. Ein weiteres häufiges Problem ist das Ineinanderlaufen von Elementen innerhalb des Bildes, was einen unrealistischen Eindruck erweckt.

Alle Arten, wie man erkennen kann, dass ein Bild mit künstlicher Intelligenz erstellt wurde

Prompt: Generate a photorealistic image of a woman holding a baseball with two hands. Credit: Jake Peterson/OpenAI

Angesichts dieser Eigenheiten arbeiten Technologieunternehmen an Lösungen für Wasserzeichen für KI-erzeugte Medien, um Transparenz und Echtheit zu gewährleisten. Dennoch bleibt die Mehrheit der KI-Kunst, die im Internet zirkuliert, unidentifiziert, was es necessary macht, ein Bewusstsein für diese verräterischen Anzeichen zu entwickeln, um nicht von Desinformationen getäuscht zu werden, die durch KI-Bilder verbreitet werden.

Lesen Sie auch:

Kommentare

Aktuelles