Ssylka

Технология INFP от bytedance оживляет портреты

Новая технология INFP, разработанная ByteDance, преобразует статические портретные фотографии в динамические, заставляя их «говорить» и реагировать на аудио. Модель анализирует нюансы человеческого поведения, включая мимику и повороты головы на основе видео, затем сопоставляет звуки с естественными движениями.
Технология INFP от bytedance оживляет портреты
Изображение носит иллюстративный характер

Инновация INFP заключается в ее способности различать роли «говорящего» и «слушающего» без дополнительной настройки. Система использует Motion-Based Head Imitation для анализа движений головы и Audio-guided motion generation для сопоставления звуков с естественными жестами. Специальный диффузионный трансформер обеспечивает плавность и естественность движений.

Разработчики внедрили коллекцию разговоров DyConv для обучения модели, что, по их утверждениям, позволило превзойти аналоги по точности сопоставления движений губ и сохранению индивидуальных черт лица. При этом создается широкий спектр естественных движений, делая оживленные портреты более реалистичными.

В планах ByteDance дальнейшее развитие INFP для объединения анимации с текстом, что позволит анимировать всё тело, расширяя творческие возможности. Несмотря на опасения некоторых пользователей относительно «жутковатого» эффекта от оживления фото, предварительные результаты показывают, что технология Bytedance достигла значительных успехов в естественности анимации.


Новое на сайте

18250Сможет ли искусственный интеллект обеспечить TSMC мировое господство? 18249Критическая уязвимость Adobe с оценкой 10.0 попала под активную атаку 18248Цифровое воскрешение прогнозов погоды из 90-х 18247Зачем мозг в фазе быстрого сна стирает детали воспоминаний? 18246Мог ли древний яд стать решающим фактором в эволюции человека? 18245Тайна колодца Мурсы: раны и днк раскрыли судьбу павших солдат 18244Битва за миллиардный сэндвич без корочки 18243Почему ваши расширения для VS Code могут оказаться шпионским по? 18242Как подать заявку FAFSA на 2026-27 учебный год и получить финансовую помощь? 18241Мог ли взлом F5 раскрыть уязвимости нулевого дня в продукте BIG-IP? 18240CVS завершает поглощение активов обанкротившейся сети Rite Aid 18239Nvidia, BlackRock и Microsoft покупают основу для глобального ИИ за $40 миллиардов 18238Действительно ли только род Homo создавал орудия труда? 18237Инженерный триумф: сотрудник Rivian вырастил тыкву-победителя 18236Процент с прибыли: как инвесторы создали новый источник финансирования для...