Может ли нейросеть генерировать картинки за 4 шага прямо на вашем смартфоне?

Генерация изображений с помощью искусственного интеллекта до сих пор оставалась привилегией мощных облачных серверов. Модели вроде Stable Diffusion, DALL-E и Midjourney требуют десятков шагов для создания одной картинки, и каждый такой шаг — это вычислительная нагрузка, с которой обычный ноутбук справляется с трудом, а телефон не справляется вовсе. Но новая модель SD3.5-Flash (полное название — Stable Diffusion 3.5 Flash) ломает эту схему радикально.
Может ли нейросеть генерировать картинки за 4 шага прямо на вашем смартфоне?
Изображение носит иллюстративный характер

Главная цифра, которую стоит запомнить: 4 шага. Именно столько нужно SD3.5-Flash для генерации изображения. Для сравнения — лучшие на сегодня модели используют порядка 40 шагов и больше. Разница в десять раз. И это не теоретическая выкладка, а работающий результат: образцы сгенерированных изображений уже существуют и доступны для оценки.
Почему количество шагов так критично? Каждый шаг в процессе генерации — это прогон нейросети через миллионы параметров. Чем больше шагов, тем больше времени и энергии тратится. На облачном сервере с кучей видеокарт это терпимо. На смартфоне с батареей на 5000 мАч и мобильным чипом — нет. Сокращение числа шагов в десять раз меняет саму экономику процесса.
SD3.5-Flash создавалась именно с прицелом на потребительские устройства. Смартфоны и ноутбуки — вот целевые платформы. Не дата-центры, не рабочие станции с несколькими GPU, а те устройства, которые лежат у вас в кармане или стоят на столе. Это принципиальный сдвиг: генерация изображений переезжает с серверов к пользователю.
Локальный запуск означает несколько вещей одновременно. Во-первых, не нужно платить за облачные вычисления. Во-вторых, не нужно отправлять запрос на удалённый сервер и ждать очереди. В-третьих, данные остаются на вашем устройстве — никакой промпт никуда не уходит.
Скептик спросит: а не страдает ли качество? Если модель делает в десять раз меньше шагов, логично предположить, что картинки будут хуже. Однако демонстрационные примеры SD3.5-Flash показывают, что модель способна выдавать визуально убедительные результаты. Конечно, прямое сравнение на сложных сценах с топовыми моделями при полном количестве шагов — это другой разговор. Но для большинства практических задач четырёх шагов, судя по всему, хватает.
Стоит понимать контекст. Индустрия генеративного ИИ последние два года занималась наращиванием мощности: больше параметров, больше данных для обучения, больше вычислений. SD3.5-Flash движется в противоположную сторону — к компактности и эффективности. И это, пожалуй, более трудная инженерная задача, чем просто увеличить модель.
Для обычного пользователя перспектива выглядит так: в обозримом будущем генерация картинок по текстовому описанию может стать стандартной функцией телефона, как сейчас — фотофильтры. Без подписок, без интернета, без задержек. Четыре шага, пара секунд, готовое изображение на экране.


Новое на сайте

20066[b]Фотосинтез в глазах мышей: возможно ли это без превращения в растение?[/b] 20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b]
Ссылка