Le persone con un account Google esistente hanno l'opportunità di sperimentare il nuovo generatore di immagini basato sull'IA di Google istantaneamente.
Il più recente strumento di creazione di immagini AI di Google, chiamato Imagen 3, è ora disponibile al pubblico negli Stati Uniti, richiedendo solo un account Google gratuito per sperimentare. Come evidenziato da VentureBeat, Google ha lanciato silenziosamente questo modello questa settimana, pubblicando la sua ricerca in un articolo martedì. Questo segue due mesi dopo che la società ha annunciato per la prima volta il nuovo modello al Google I/O di maggio.
Secondo un post su Hugging Face, una piattaforma di machine learning, i ricercatori di Google hanno condiviso: "Presentiamo Imagen 3, un modello di diffusione latente che genera immagini di alta qualità da prompt testuali. Forniamo i dettagli delle nostre valutazioni di qualità e responsabilità. Imagen 3 supera altri modelli all'avanguardia in termini di prestazioni al momento della valutazione. Inoltre, discutiamo i problemi legati alla sicurezza e alla rappresentazione, nonché le misure che abbiamo adottato per minimizzare eventuali danni causati dai nostri modelli".
Sulla base di alcuni test preliminari che ho condotto, il modello sembra piuttosto affidabile. Quando si richiedono immagini fotorealistiche, i risultati sono generalmente di alta qualità, con tentativi convincenti di realismo che potrebbero ingannare le persone a prima vista. (Sono rimasto particolarmente colpito dalla qualità dell'immagine quando ho chiesto al modello di creare un look da 35mm vintage.) Imagen 3 evidenzia anche gli aspetti significativi del prompt che hanno influenzato l'output, consentendoti di regolare questi aspetti se non sei soddisfatto dell'immagine finale.
Tuttavia, gli output di Imagen 3 mantengono sottili tracce di immagini generate da AI. In alcune foto, le mani hanno un numero strano di dita, i volti sono distorti e il testo non ha senso. (although the model was able to accurately reproduce the "Coca-Cola" and "Canon" logos, infringing on trademarks.)
Credit: Jake Peterson/Google
Google non è l'unica società tecnologica che rilascia un nuovo modello di immagini questa settimana. X ha recentemente introdotto una nuova versione beta di Grok, il suo chatbot AI, e con esso, un generatore di immagini con apparenti limitazioni minime. Gli utenti, specificamente Michelle Ehrhardt di Lifehacker, hanno creato una varietà di contenuti utilizzando Grok, dalla Taylor Swift con il cappello MAGA a Pikachu che impugna un AK-47.
Al contrario, Imagen 3 mostra chiari meccanismi di sicurezza. Quando tento di utilizzare il generatore di immagini di Google per argomenti controversi, si ferma e mi dirige cortesemente alle FAQ di Imagen 3 per comprendere perché il prompt era inappropriato. Inoltre, si rifiuta di generare materiale protetto da copyright, ma può essere indotto a farlo con prompt precisi. Come menzionato in precedenza, sono stato in grado di riprodurre loghi, riuscendo addirittura a estrarre personaggi marchiati come Mario e Pikachu, anche se non hanno partecipato a uno scontro a fuoco.
Come utilizzare Imagen 3
Credit: Jake Peterson/Google
Il nuovo strumento di generazione di immagini AI di Google è gratuito per qualsiasi utente degli Stati Uniti con un account Google per provarlo. Per farlo, naviga su ImageFX nel Google AI Test Kitchen. Basta accedere con il tuo account Google e sei a posto, pronto per i prompt.
Il rilascio iniziale di Imagen 3, uno strumento di generazione di immagini AI rivoluzionario di Google, ha suscitato interesse nella comunità tecnologica. Con Imagen 3, gli utenti possono creare immagini di alta qualità da prompt testuali, rendendolo un'aggiunta degna di nota all'arsenale di strumenti AI del campo tecnologico.
Inoltre, i giganti della tecnologia come Google e X continuano a spingere i limiti dell'IA, come dimostrato da Imagen 3 di Google e dal generatore di immagini di X nei loro rispettivi nuovi rilasci. Questi progressi stanno aprendo nuove vie per la creazione di contenuti, come dimostrato dalle immagini diverse generate utilizzando Grok.
Credit: Jake Peterson/Google