Новый генератор изображений от Google labs: Whisk

Google Labs разрабатывает Whisk, генератор изображений, использующий три изображения в качестве входных данных. Пользователь выбирает изображение персонажа, сцены и стиля, а нейросеть Imagen 3 комбинирует их, создавая новое изображение. Этот подход позволяет обходиться без сложных текстовых запросов. Имеется возможность дополнять описание текстовыми подсказками, например, «герой на летающем мотоцикле».
Новый генератор изображений от Google labs: Whisk
Изображение носит иллюстративный характер

Инструмент предназначен для быстрого визуального исследования, а не для точной пиксельной обработки. Whisk акцентирует внимание на ключевых чертах исходных изображений. Это может приводить к непредсказуемому результату, а потому у пользователя есть возможность редактирования базовых подсказок. Если нет собственных картинок, Whisk предлагает сгенерированные ИИ изображения-подсказки.

В настоящее время Whisk доступен только ограниченному кругу пользователей в США. Эксперимент демонстрирует потенциал нейросетей в создании уникальных изображений, предлагая пользователю роль куратора, а не непосредственного художника. Несмотря на возможность редактирования, основным принципом работы является генерация идей, а не покадровое изменение изображения.


Новое на сайте