Ssylka

Генерация видео с помощью HunyuanVideo: возможности и ограничения

HunyuanVideo — нейросеть от Tencent, способная создавать пятисекундные видео по текстовым описаниям на английском и китайском языках. Модель работает на основе мультимодальной архитектуры и использует более 13 миллиардов параметров, генерируя ролики в разрешениях 544p и 720p. Нейросеть доступна как онлайн на сайте Tencent, так и для локальной установки на компьютер с мощной видеокартой NVIDIA, поддерживающей CUDA.
Генерация видео с помощью HunyuanVideo: возможности и ограничения
Изображение носит иллюстративный характер

Несмотря на заявленное высокое качество, сравнение с аналогами показывает неоднозначные результаты. HunyuanVideo демонстрирует реалистичное движение, текстуры и освещение в большинстве случаев, но иногда выдает артефакты генерации, например, неестественные движения объектов или искажения, вроде дополнительных плавников у рыб. Однако, сценам с автомобилями, подводным миром и пейзажами в целом удается соответствовать описанию.

Для установки модели на ПК требуются значительные ресурсы: GPU NVIDIA с поддержкой CUDA и от 45 до 80 ГБ видеопамяти. Это делает нейросеть менее доступной для широкого круга пользователей. Несмотря на то, что HunyuanVideo превосходит некоторых конкурентов, например, Runway Gen-3 Alpha Turbo и Dream machine от Luma, по качеству, есть предположение, что другие модели могут демонстрировать более реалистичные результаты. Развитие подобных технологий движется в сторону увеличения продолжительности создаваемых видео, что может стать следующим шагом для HunyuanVideo.


Новое на сайте

18604Является ли рекордная скидка на Garmin Instinct 3 Solar лучшим предложением ноября? 18603Могла ли детская смесь ByHeart вызвать национальную вспышку ботулизма? 18602Готовы ли банки доверить агентскому ИИ управление деньгами клиентов? 18601Как сезонные ветры создают миллионы загадочных полос на Марсе? 18600Как тело человека превращается в почву за 90 дней? 18599Как ваш iPhone может заменить паспорт при внутренних перелетах по США? 18598Мозговой шторм: что происходит, когда мозг отключается от усталости 18597Раскрыта асимметричная форма рождения сверхновой 18596Скидки Ninja: как получить идеальную корочку и сэкономить на доставке 18595Почему работа на нескольких работах становится новой нормой? 18594Записная книжка против нейросети: ценность медленного мышления 18593Растущая брешь в магнитном щите земли 18592Каким образом блокчейн-транзакции стали новым инструментом для кражи криптовалюты? 18591Что скрывается за ростом прибыли The Walt Disney Company? 18590Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI?