Ssylka

Автоматизированный видеомонтаж с использованием нейросетей и OpenCV

Статья описывает процесс автоматизации монтажа видеороликов для социальных сетей, используя нейросети и библиотеку OpenCV. Авторы столкнулись со сложностями при работе с монтажёрами, поэтому решили самостоятельно разработать решение, позволяющее автоматически заменять фон и добавлять необходимые эффекты. Начали с использования масок OpenCV для удаления зелёного фона, однако столкнулись с проблемами из-за шума и световых отражений.
Автоматизированный видеомонтаж с использованием нейросетей и OpenCV
Изображение носит иллюстративный характер

Для более качественного удаления фона была выбрана нейросеть Robust Video Matting (RVM), которая эффективно отделяет передний план от фона, учитывая временную последовательность кадров. RVM использует архитектуру кодера-декодера с рекуррентным декодером ConvGRU для сохранения информации о предыдущих кадрах. При этом, перед подачей видео в RVM, ролик обрабатывался OpenCV для удаления шума, увеличения насыщенности и подготовки фона. Затем была выполнена синхронизация FPS основного и фонового видео.

Также была реализована замена синего экрана телефона с помощью маски, а также эффект зума для привлечения внимания к элементам. Для поиска элементов на кадре, использовался поиск шаблонов OpenCV, но с предварительной обработкой кадра для уменьшения шумов. Для улучшения стабильности поиска, применялся не только поиск шаблона, но и поиск областей, похожих по цвету. Кроме того, для акцентирования внимания на найденных элементах был применен эффект зума с одновременным затемнением кадра. В финале добавлялись субтитры с помощью whisperx, звук с помощью модели silero и все это монтировалось с помощью FFMPEG.


Новое на сайте

16935Как рентгеновское зрение раскрывает самые бурные процессы во вселенной? 16934Уязвимость нулевого дня в SonicWall VPN стала оружием группировки Akira 16933Может ли государственный фонд единолично решать судьбу американской науки? 16932Способна ли филантропия блогеров решить мировой водный кризис? 16931Взлом через промпт: как AI-редактор Cursor превращали в оружие 16930Мог ли древний кризис заставить людей хоронить мертвых в печах с собаками? 16929Какие наушники Bose выбрать на распродаже: для полной изоляции или контроля над... 16928Может ли искусство напрямую очищать экосистемы от вредителей? 16927Вирусное наследие в геноме человека оказалось ключевым регулятором генов 16926Рекордные оазисы жизни обнаружены в бездне океанских траншей 16925Крах прогнозов UnitedHealth на фоне растущих издержек и трагедий 16924Формула ясного ума: доказанный способ замедлить когнитивное старение 16923Действительно ли ощущения тепла и прохлады идут в мозг разными путями? 16922Гражданские права как инструмент холодной войны 16921Премиальное белье Duluth Trading Co. со скидкой более 50%