Ssylka

Автоматизированный видеомонтаж с использованием нейросетей и OpenCV

Статья описывает процесс автоматизации монтажа видеороликов для социальных сетей, используя нейросети и библиотеку OpenCV. Авторы столкнулись со сложностями при работе с монтажёрами, поэтому решили самостоятельно разработать решение, позволяющее автоматически заменять фон и добавлять необходимые эффекты. Начали с использования масок OpenCV для удаления зелёного фона, однако столкнулись с проблемами из-за шума и световых отражений.
Автоматизированный видеомонтаж с использованием нейросетей и OpenCV
Изображение носит иллюстративный характер

Для более качественного удаления фона была выбрана нейросеть Robust Video Matting (RVM), которая эффективно отделяет передний план от фона, учитывая временную последовательность кадров. RVM использует архитектуру кодера-декодера с рекуррентным декодером ConvGRU для сохранения информации о предыдущих кадрах. При этом, перед подачей видео в RVM, ролик обрабатывался OpenCV для удаления шума, увеличения насыщенности и подготовки фона. Затем была выполнена синхронизация FPS основного и фонового видео.

Также была реализована замена синего экрана телефона с помощью маски, а также эффект зума для привлечения внимания к элементам. Для поиска элементов на кадре, использовался поиск шаблонов OpenCV, но с предварительной обработкой кадра для уменьшения шумов. Для улучшения стабильности поиска, применялся не только поиск шаблона, но и поиск областей, похожих по цвету. Кроме того, для акцентирования внимания на найденных элементах был применен эффект зума с одновременным затемнением кадра. В финале добавлялись субтитры с помощью whisperx, звук с помощью модели silero и все это монтировалось с помощью FFMPEG.


Новое на сайте

17900Сможет ли закон догнать искусственный интеллект, предлагающий психотерапию? 17899Цепная реакция заражения листерией из-за одного поставщика 17898Холодный расчет: как современная наука изменила правила стирки 17897Деревянная начинка: массовый отзыв корн-догов из-за угрозы травм 17896Случайное открытие, спасшее 500 миллионов жизней 17895Мастерство мобильной съемки: полное руководство по камере iPhone 17894Что мог рассказать личный набор инструментов охотника эпохи палеолита? 17893Почему крупнейшая звездная колыбель млечного пути производит непропорционально много... 17892Обречены ли мы есть инжир с мертвыми осами внутри? 17891Почему AI-помощникам выгодно лгать, а не признавать незнание? 17890Является ли творчество искусственного интеллекта предсказуемым недостатком? 17889Как каланы цепляются за надежду? 17888Расшифрованный код древнего Египта 17887Звук без компромиссов: выбор лучших активных полочных колонок 2025 года 17886Зеленая немочь: загадочная болезнь девственниц, исчезнувшая из медицины