Генераторы преобразования текста в изображения революционизируют интернет
Видение будущего стало реальностью: недавно в свободном доступе появились программы, генераторы преобразования текста в изображение. Они могут представлять собой одну из величайших технологических инноваций.
Читайте также: Как генераторы изображений DALL‑E AI распространяют предрассудки
Это похоже на технические премудрости. Вы набираете совершенно абсурдную фразу – например, «портрет аллозавра, одетого как купец в 1500‑х годах, в стиле Рембрандта» и получаете подборку изображений, демонстрирующих именно это. Даже если вы были первым человеком, которому пришла в голову эта мысль.
Творения DALL‑E «Портрет аллозавра, одетого как торговец 1500‑х годов в стиле Рембрандта». Смотри, у них есть губы! pic.twitter.com/IYWZfE7I1l
— Деннис Хансен (@DennisMHansen) 31 июля 2022 г.
Это стало возможным благодаря таким программам, как DALL‑E, Midjourney и Stable Diffusion. Генераторы преобразования текста в изображение, которые могут использовать искусственный интеллект (ИИ) для создания графики, в последнее время встречаются повсеместно.
Программы разрабатывались и тренировались в тайне в течение многих лет. Но время открытия тайны прошло. И вот теперь выясняется, что эта технологическая новинка способна в корне изменить интернет.
Генераторы преобразования текста в изображения: как работают DALL‑E, Midjourney и Ко?
Несмотря на то что существуют различные поставщики услуг, принцип, лежащий в его основе, всегда один и тот же. В программы поступает бесчисленное количество маркированных изображений, которые затем автоматически анализируются.
ИИ работает примерно так же, как человеческий ребенок, которому по мере взросления снова и снова показывают изображение выдры и говорят, что это животное называется «выдра». В какой-то момент искусственный интеллект устанавливает связь между внешним видом выдры и словом «выдра» и способен изобразить ее по запросу.
Программы также изучают, как определенные объекты взаимодействуют друг с другом. Например, что выдры часто держатся возле воды и что их тело по строению похоже на тело других млекопитающих.
«Калан в стиле «Девушки с жемчужной сережкой» Иоганна Вермеера». # далле pic.twitter.com/tjRMujvj7C
— OpenAI (@OpenAI) 6 апреля 2022 г.
И наконец, программа научилась настолько многому, что может не только изображать животных, предметы и людей, но даже имитировать некоторые стили искусства. Результатом может быть, например, изображение выдры в стиле знаменитого художника Вермеера, которое на первый взгляд трудно отличить от работы человека.
Генераторы преобразования текста в изображения: каковы предложения?
У тех, кто хочет самостоятельно опробовать инструменты ИИ, есть несколько вариантов: DALL‑E, вероятно, самая известная программа, до сих пор предназначена для избранных пользователей и ставит заинтересованных лиц в очередь.
Другие программы находятся в свободном доступе, хотя большинство из них стоят денег. ИИ Midjourney, например, может работать через программу чата Discord, и, прежде всего, блещет художественными и абстрактными образами.
Искусственный интеллект — это когда ты легко можешь собрать атмосферный хоррор-кавер, но не знаешь, сколько у тебя пальцев на руке pic.twitter.com/6sLKz4Inuq
— Грегор Шмальзирид (@Grexgor) 10 августа 2022 г.
Но все еще испытывает трудности с человеческими лицами и частями тела. Например, когда нужно изобразить руку с правильным количеством пальцев.
Между тем программы Stable Diffusion и Crayion (ранее известная как DALL‑E Mini) делают это особенно легко. Ими можно управлять и опробовать бесплатно в веб-браузере.
Кому принадлежат изображения, созданные ИИ?
Каждый инструмент поставляется со своими условиями использования. Обычно они предусматривают, что изображения принадлежат тому, кто их создал, то есть пользователю. Однако некоторые программы, в том числе Midjourney, предусматривают специальные правила для использования крупными коммерческими компаниями.
Как будут использоваться изображения?
Уже сейчас становится очевидным, что эта технология может стать не чем иным, как революцией. Для блогов и журналов компьютерная графика является альтернативой стоковым фотографиям и иллюстрациям и уже используется такими изданиями, как The Atlantic.
Искусственный интеллект — это когда ты легко можешь собрать атмосферный хоррор-кавер, но не знаешь, сколько у тебя пальцев на руке pic.twitter.com/6sLKz4Inuq
— Грегор Шмальзирид (@Grexgor) 10 августа 2022 г.
Универсальность технологии также делает ее альтернативой программам редактирования изображений, таким как Photoshop. С помощью DALL‑E вы можете не только создавать совершенно новые образы, но и перерабатывать уже существующие. Например, переодевание человека и создание виртуального показа мод.
Революция только началась
Ясно одно: хотя концепция этой технологии то и дело подвергается критике (например, со стороны иллюстраторов, опасающихся за свою работу), генераторы изображений, подобные DALL‑E и Midjourney, будут играть важную роль в будущем. Уже сейчас программы удивительно хороши, и они становятся все лучше и лучше. Дальнейшее развитие событий — лишь вопрос времени.
Например, даже TikTok в настоящее время работает над генератором изображений с искусственным интеллектом, который интегрирован непосредственно в приложение. Это неожиданно сделает миллионы людей осведомленными о технологии.
Другая проблема заключается в том, что эти инструменты могут быть использованы не по назначению. Стартап под названием Stability AI недавно объявил о публикации генератора изображений практически без рекомендаций. Это может позволить, например, создавать фальшивые фотографии обнаженных реальных людей.
Читайте также по теме:
- «Страсти по Обераммергау»: антиеврейские изображения удалены
- Космический телескоп «Джеймс Уэбб» в работе: первые изображения
- Google Maps отрицает наличие изображений военных объектов РФ