Tutti i modi per dire che un'immagine è stata creata con l'IA

Tutti i modi per dire che un'immagine è stata fatta con l'IA

Questo post fa parte della serie di Lifehacker "Esposizione dell'IA". Stiamo esplorando sei tipi diversi di media generati dall'IA e mettendo in evidenza le peculiarità, i prodotti secondari e le caratteristiche comuni che aiutano a distinguere tra contenuti artificiali e umani.

L'arte dell'IA non è più solo un concetto: è ovunque e probabilmente l'hai incontrata nella vita reale, anche se non lo sapevi. L'arte dell'IA ha vinto premi (anche se tra controversie), è stata utilizzata in film di Netflix (sempre sotto critiche) e ha ingannato numerosissimi utenti di Facebook con false immagini di bambini, Gesù e verdure. Non se ne andrà tanto presto.

Man mano che la tecnologia per generare immagini continua a migliorare, è più importante che mai imparare a riconoscere queste immagini generate dall'IA, in modo da non essere ingannati dalle foto false di qualcun altro. Anche se può sembrare innocuo non pensare due volte a un'immagine generata dall'IA di qualche anatra, quando gli attori malevoli diffondono disinformazione attraverso le immagini dell'IA, le conseguenze sono gravi. Le aziende che producono generatori di immagini dell'IA stanno lavorando per trovare modi per "marcare" le immagini prodotte dall'IA, ma non ci siamo ancora arrivati. La maggior parte dell'arte dell'IA online circola senza un'etichetta chiara che avverta gli utenti che le immagini non sono reali. In attesa di questo, questi consigli possono aiutarti a riconoscere queste immagini false quando appaiono nel tuo feed.

Come funzionano i generatori di arte dell'IA

È facile guardare un'opera d'arte dell'IA e supporre che il generatore che l'ha prodotta l'abbia semplicemente assemblata da un mucchio di immagini nel suo database. In realtà, non è così che funziona.

I generatori di arte dell'IA sono addestrati su enormi dataset di immagini, dall'arte alle fotografie. Tuttavia, questi strumenti non "vedono" queste immagini come fanno gli esseri umani. Invece, le suddividono pixel per pixel. Non vedrà una mela; vedrà un gruppo di pixel e i loro valori. Con il tempo, imparerà che questo gruppo di questi valori di pixel specifici tende a essere una mela. Addestrando l'IA su abbastanza immagini con abbastanza contesto, inizierà a tracciare linee tra tutti i tipi di oggetti e stili. Capirà come rendere generalmente frutta, animali e persone, nonché stili artistici, colori e umori.

I moderni generatori di immagini dell'IA, come DALL-E, utilizzano ciò che viene chiamato "diffusione" per imparare e generare immagini. In sostanza, prendono un'immagine di addestramento e aggiungono rumore visivo (pensiamo al disturbo) all'immagine finché l'intera immagine non diventa priva di senso. L'idea è quella di capire come l'immagine viene influenzata dall'aggiunta di rumore a ogni passo: Da qui, cercano di fare l'opposto, creando la loro versione dell'immagine originale dal nulla solo con il rumore, che addestra l'IA a creare immagini dal nulla.

Tutti i Modi per Mostrare che una foto È stata Creata con l'AI

Prompt: "Generate an image of a group of friends smiling at each other while playing a board game."Credit: Jake Peterson/OpenAI

Questa è un'estremamente semplificata spiegazione, ma è importante conoscere il concetto fondamentale che questi generatori si basano su un'enorme base di relazioni apprese. Questo rende possibile rendere scene complesse in pochi secondi, ma è anche ciò che determina le strane peculiarità che possono aiutarci a identificare un'immagine dell'IA rispetto a una vera.

Conta le dita

L'arte dell'IA sta migliorando, ma non è ancora perfetta. Anche se questi strumenti sono in grado di generare immagini di alta qualità con illuminazione realistica, ancora lottano con i dettagli più piccoli.

Forse più famoso, i "soggetti umani" nell'arte dell'IA tendono ad avere il numero di dita sbagliato. Magari il resto dell'immagine sembra convincente a prima vista, ma guarda le mani e noterai sei, sette o otto dita per mano. O magari è il contrario, e la mano ha tre dita, due delle quali si stanno fondendo in una. In ogni caso, le dita e le mani a cui sono attaccate sono spesso confuse.

Ma mentre le dita sono ciò di cui l'IA è più famosa per sbagliare, i suoi problemi non si fermano alle mani. Qualsiasi schema ripetitivo, soprattutto quando riguarda i dettagli umani, può essere generato in modo errato con l'arte dell'IA. Guarda i denti di un soggetto in un'immagine: A volte ce ne sono troppi, o sembrano distorti in un modo che non sarebbe mai normale. La maggior parte di noi non ha sorrisi perfetti, ma i denti dell'IA sono a un altro livello.

Potresti persino vedere un soggetto con un arto in più: Stai guardando un'immagine, chiedendoti cosa c'è che non va, quando all'improvviso noti il terzo braccio del soggetto che esce dalla sua felpa.

Tutti i modi per capire che un'immagine è stata creata con l'AI

Ask DALL-E to generate a map, and it does to some degree of accuracy, albeit with "AI writing."Credit: Jake Peterson/OpenAI

Vox ha un video fantastico che esplora il motivo per cui l'IA fa fatica con questi elementi ripetitivi, ma, in sostanza, dipende dalla mancanza di esperienza dell'IA. Questi strumenti sono addestrati su una quantità enorme di dati, ma quando si tratta di qualcosa di complicato come le mani, i dati che ha non forniscono abbastanza contesto all'IA per sapere come generare l'elemento in modo corretto e realistico. Non sa come funzionano veramente le mani - può solo attingere alle mani che vede. Stiamo assistendo ai limiti di questa conoscenza qui.

Ma non sono solo i soggetti: Tutto nell'immagine è un bersaglio lecito per questo mescolamento. Guarda l'immagine che ho generato con DALL-E qui sotto. La scacchiera è ondulata, con parti della scacchiera che si trasformano in altre parti, e pezzi che si fondono con le piastrelle. I denti della donna sulla destra sono tutti schiacciati insieme, mentre i polsini del maglione dell'altra donna si piegano su se stessi. (Non menzioniamo il fatto che le sue dita si fondono in una.)

Critica alla scrittura

L'IA potrebbe essere in grado di generare testo, ma spesso non sa scrivere bene in un'immagine. In molti casi, l'arte dell'IA che include la scrittura sembra storta. A volte è un logo che assomiglia al suo corrispondente nel mondo reale, ma non ci arriva del tutto. (Puoi capire che sta cercando di dire Coca-Cola, ma tutte le lettere si mescolano.) Altre volte sembra che qualcuno stia cercando di inventare una lingua, o come ci si sente a leggere qualcosa in un sogno. (In effetti, molte di queste immagini dell'IA hanno un'aria da sogno, almeno per me.)

Adesso, questo lato dell'arte dell'IA sta migliorando rapidamente. both DALL-E e Meta AI sono stati in grado di generare un'immagine di una torta che dice "BUON COMPLEANNO KAREN" senza problemi evidenti. Detto questo, quella di Meta non era perfetta: la seconda "P" in "BUON" sembrava più una "Y", mentre la "A" in "KAREN" aveva due linee invece di una. Ma è importante notare che queste immagini vengono fuori meglio quando si chiede esplicitamente all'IA di scriverle: se chi ha creato l'immagine non ha pensato di correggerla, può essere un segno evidente.

Chiedi a DALL-E di generare una mappa, e lo fa fino a un certo grado di accuratezza, anche se con "scrittura dell'IA". Credito: Jake Peterson/OpenAI## Cerca cose che semplicemente non hanno senso

Tutti i modi per dire che un'immagine è stata creata con l'IA

Prompt: "Generate an image of a basement party: People play beer bong, drink from red solo cups, and chat."Credit: Jake Peterson/OpenAI

Alla fine della giornata, l'arte dell'IA non sa veramente nulla. Sta producendo arte in base alle relazioni che ha creato dai suoi dati di addestramento. Non sa come si costruisce veramente un edificio, come si gioca a tennis o come si muove una mano umana. Se guardi attentamente, puoi vedere queste lacune nella conoscenza apparire in tutta l'arte dell'IA, specialmente nelle immagini con molte cose che succedono.

Prendi questa immagine, per esempio: Ho chiesto a DALL-E di generare un'immagine di una festa in cantina, con persone che giocano a beer pong, bevono da bicchieri rossi di plastica e chiacchierano. Subito si presentano problemi evidenti: gli occhi delle persone inquadrate sono per lo più storti; la mano dell'uomo che gioca a beer pong è tutta scombinata; e perché sta lanciando palle da ping pong dal lato del tavolo? Parlando del tavolo, è ondulato e si sta deformando in un modo in cui un tavolo vero non lo farebbe, e ci sono due serie di bicchieri su un lato del tavolo per qualche motivo.

Guarda verso lo sfondo, e le cose diventano ancora più strane. Un uomo sembra inginocchiato, bevendo il suo bicchiere rosso come se fosse una bottiglia. L'uomo dietro di lui sembra avere una lattina blu dentro il suo bicchiere rosso, come se il bicchiere fosse un portabottiglie. La persona dietro di lui sembra avere la sua faccia Photoshoppata, sfocata come soggetto è.

Prompt: "Genera un'immagine di una festa in cantina: le persone giocano a beer pong, bevono da bicchieri rossi di plastica e chiacchierano." Credito: Jake Peterson/OpenAIAnche gli esempi ufficiali delle aziende che fanno questi strumenti hanno queste incongruenze logiche. OpenAI ha un'immagine divertente di un avocado dallo psicoterapeuta per mostrare DALL-E 3.

Credito: OpenAIL'avocado ha un nocciolo scavato e si lamenta con lo psicoterapeuta, che è un cucchiaio, di sentirsi vuoto dentro. È una buona battuta, ma guarda il blocco notes dello psicoterapeuta: sta scrivendo al contrario, con le pagine rivolte verso l'esterno. DALL-E ha visto abbastanza immagini di psicoterapeuti da sapere quali strumenti usano di solito per scrivere appunti, ma non capisce che noi umani di solito scriviamo sulla carta, non sul supporto.

Certo, i post dell'IA che diventano virali sui siti di social media come Facebook non hanno senso per nulla. Chi sta costruendo sculture di gatti con i biscotti Oreo? Perché ci sono così tanti artisti tristi che costruiscono castelli di sabbia di Gesù? L'arte può essere immaginativa, ma l'arte dell'IA è particolarmente strana, sia nei dettagli che nei temi più ampi.

Credit: OpenAI

Lustrini dell'IA

Dopo aver guardato le immagini dell'IA per un po', inizi a notare qualcosa di peculiare, specialmente tra le immagini foto-realistiche: tutto è lucido. Le immagini dell'IA spesso hanno quello che alcuni chiamano "lustrini dell'IA", un lucido che può tradire l'origine dell'immagine se sai cosa cercare. Le immagini sono spesso sovraesposte o presentano una luce drammatica, che rende i soggetti particolarmente brillanti.

Dopo un po', guardi una foto come quella qui sotto e sai subito che è stata fatta con l'IA, solo guardando come sembra. (Anche se le mani del soggetto non erano storte, come anche.)

Mentre questi consigli potrebbero essere rilevanti oggi, la tecnologia AI sta continuando ad evolversi e migliorare, e potrebbe rendere questi consigli inutili nel prossimo futuro. L'AI è già migliore nella scrittura, quindi chi può dire che non troverà un modo per generare mani realistiche ogni volta? O per impedire agli elementi della foto di fondersi insieme? O per smettere di aggiungere strane cose agli sfondi delle immagini? E mentre i consigli sopra sono attualmente utili per le immagini foto-realistiche, può essere più difficile identificare l'arte generata dall'AI: questi pezzi possono avere gli stessi difetti notati sopra, ma è più facile mascherare queste incongruenze con la "pittura", che è spesso mescolata, meno realistica e più aperta all'interpretazione.

Mentre ci dirigiamo verso un anno elettorale particolarmente turbolento, sarà più importante che mai alzare il tuo radar BS mentre navighi in internet. Prima di rimanere impressionati dall'opera d'arte dettagliata di qualcuno, o infuriati da un'immagine offensiva, pensaci due volte: questa immagine è anche reale?

Despite the advancements in AI technology, it's still possible to identify AI-generated images with signs of imperfection. One such giveaway is the frequent error in representing human fingers, often resulting in too many or incorrectly shaped digits. Another common issue is the blending of elements within the image, creating an unrealistic appearance.

Tutti i modi per determinare che un'immagine è stata creata con l'intelligenza artificiale

Prompt: Generate a photorealistic image of a woman holding a baseball with two hands. Credit: Jake Peterson/OpenAI

In light of these quirks, tech companies are working on watermarking solutions for AI-produced media to ensure transparency and authenticity. However, the majority of AI art circulating online remains unidentified, making it crucial to develop an awareness of these telltale signs to avoid being deceived by disinformation spread through AI images.