Искусственный интеллект в анимации: новогоднее приключение Умки

Нейросеть Kandinsky 4.0 Video, разработанная Сбером, демонстрирует возможности создания видеороликов на основе текстового описания или начального кадра. Она обучена на огромном массиве данных, включая 350 миллионов изображений и 220 миллионов видеороликов, что позволяет ей генерировать 12-секундные видео в HD-разрешении. Хотя бета-версия доступна пока только для креативных индустрий, ожидается, что в 2025 году она станет доступна широкой публике.
Искусственный интеллект в анимации: новогоднее приключение Умки
Изображение носит иллюстративный характер

Сотрудничество «Союзмультфильма» с Kandinsky позволило создать новогодний ролик с Умкой. В студии используют ИИ для ускорения различных процессов, включая разработку мудбордов, поиск стилистики, визуализацию эскизов и улучшение качества изображения. Кроме того, ИИ применяется для липсинка, сложного процесса синхронизации губ персонажа с речью.

Критики отмечают, что, несмотря на технологический прогресс и использование HD-разрешения, качество анимации пока не соответствует высоким стандартам. Персонажи выглядят разными в различных кадрах, а в некоторых сценах присутствуют заметные дефекты, например, движение земли на 11 секунде. Это подчеркивает необходимость дальнейшей доработки и улучшения качества нейросетей для анимации.

Вместе с тем, возможность генерации видео с использованием текстовых описаний и стартовых кадров является перспективным направлением. Основным конкурентом Kandinsky 4.0 Video на рынке может стать Sora. ИИ потенциально мощный инструмент, но его влияние на анимационную индустрию остается предметом дискуссий.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm
Ссылка