Нейросеть Imagen от Google сама создает картинки из текста
Нейросеть Imagen была представлена широкой аудитории компанией Google 24 мая. Разработкой современной технологии занималась отдельная команда из исследовательского центра Google Brain.
Читайте также: Google помог обнаружить кардиомиопатию у британки.
В проекте принимали участие специалисты, изучающие и развивающие искусственный интеллект. Вместе с презентацией, компания показала качественные примеры работ нейросети, которые значительно превосходят показатели уже существующей схожей технологи DALL‑E 2.
Нейросеть Imagen: примеры изображений и принцип работы
Для распознавания текста нейросеть использует большое количество актуальных языковых моделей. После детального изучения передаваемых данных создается первичное тестовое изображение размером, не превышающим 64 х 64 пикселя.
На следующем этапе искусственный интеллект начинает самостоятельно дорисовывать изображение, постепенно увеличивая разрешение и размеры картинки. В процессе работы появляются новые детализированные элементы изображения, что позволяет получить на выходе картинку в максимально возможном качестве.
Компания Google уже предлагает всем желающим ознакомиться с технической демоверсией нейросети на своем сайте. Каждый пользователь может самостоятельно создать собственное уникальное изображение с помощью высоких технологий.
Пока система работает в тестовом режиме, поэтому существует ряд определенных ограничений. Например, самостоятельно вводить любые желаемые текстовые запросы и отправлять их на обработку нельзя. Придется выбирать слова из заранее подготовленного фиксированного списка.
Как отмечает Google, другие нейросети сталкиваются с рядом проблем, основной из которых становится неправильная оценка передаваемого текста. В результате финальное изображение может значительно отличаться от желаемого.
Нейросеть Imagen лишена этих недостатков. Она будет функционировать и регулярно тестироваться специальным бенчмарком DrawBench. Он постоянно анализирует корректное распознавание искусственным интеллектом слов и фраз, чтобы добиться максимально точного результата при создании изображения.
Компания Google добавила, что пока у нее нет планов делать инновационную нейросеть Imagen общедоступной. Такое решение было вызвано предубеждениями о некорректном использовании технологии со стороны многочисленных недобросовестных пользователей для создания неприемлемого контента.
Публичный релиз ждать в ближайшее время не стоит. Компания обещает провести тесты и разработать способ, который позволит тщательнее оценивать культурные и социальные положения, чтобы избежать создания пользователями недопустимых изображений.
Читайте также:
- Тон Тхат Тунг: Google посвятил свой doodle вьетнамскому хирургу
- Google Play запретил россиянам обновлять и покупать приложения
- Google продает данные пользователей и их геолокацию