Искусственный интеллект в анимации: новогоднее приключение Умки

Нейросеть Kandinsky 4.0 Video, разработанная Сбером, демонстрирует возможности создания видеороликов на основе текстового описания или начального кадра. Она обучена на огромном массиве данных, включая 350 миллионов изображений и 220 миллионов видеороликов, что позволяет ей генерировать 12-секундные видео в HD-разрешении. Хотя бета-версия доступна пока только для креативных индустрий, ожидается, что в 2025 году она станет доступна широкой публике.
Искусственный интеллект в анимации: новогоднее приключение Умки
Изображение носит иллюстративный характер

Сотрудничество «Союзмультфильма» с Kandinsky позволило создать новогодний ролик с Умкой. В студии используют ИИ для ускорения различных процессов, включая разработку мудбордов, поиск стилистики, визуализацию эскизов и улучшение качества изображения. Кроме того, ИИ применяется для липсинка, сложного процесса синхронизации губ персонажа с речью.

Критики отмечают, что, несмотря на технологический прогресс и использование HD-разрешения, качество анимации пока не соответствует высоким стандартам. Персонажи выглядят разными в различных кадрах, а в некоторых сценах присутствуют заметные дефекты, например, движение земли на 11 секунде. Это подчеркивает необходимость дальнейшей доработки и улучшения качества нейросетей для анимации.

Вместе с тем, возможность генерации видео с использованием текстовых описаний и стартовых кадров является перспективным направлением. Основным конкурентом Kandinsky 4.0 Video на рынке может стать Sora. ИИ потенциально мощный инструмент, но его влияние на анимационную индустрию остается предметом дискуссий.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка