Google Labs разрабатывает Whisk, генератор изображений, использующий три изображения в качестве входных данных. Пользователь выбирает изображение персонажа, сцены и стиля, а нейросеть Imagen 3 комбинирует их, создавая новое изображение. Этот подход позволяет обходиться без сложных текстовых запросов. Имеется возможность дополнять описание текстовыми подсказками, например, «герой на летающем мотоцикле».
Инструмент предназначен для быстрого визуального исследования, а не для точной пиксельной обработки. Whisk акцентирует внимание на ключевых чертах исходных изображений. Это может приводить к непредсказуемому результату, а потому у пользователя есть возможность редактирования базовых подсказок. Если нет собственных картинок, Whisk предлагает сгенерированные ИИ изображения-подсказки.
В настоящее время Whisk доступен только ограниченному кругу пользователей в США. Эксперимент демонстрирует потенциал нейросетей в создании уникальных изображений, предлагая пользователю роль куратора, а не непосредственного художника. Несмотря на возможность редактирования, основным принципом работы является генерация идей, а не покадровое изменение изображения.
Изображение носит иллюстративный характер
Инструмент предназначен для быстрого визуального исследования, а не для точной пиксельной обработки. Whisk акцентирует внимание на ключевых чертах исходных изображений. Это может приводить к непредсказуемому результату, а потому у пользователя есть возможность редактирования базовых подсказок. Если нет собственных картинок, Whisk предлагает сгенерированные ИИ изображения-подсказки.
В настоящее время Whisk доступен только ограниченному кругу пользователей в США. Эксперимент демонстрирует потенциал нейросетей в создании уникальных изображений, предлагая пользователю роль куратора, а не непосредственного художника. Несмотря на возможность редактирования, основным принципом работы является генерация идей, а не покадровое изменение изображения.