Автоматизированный видеомонтаж с использованием нейросетей и OpenCV

Статья описывает процесс автоматизации монтажа видеороликов для социальных сетей, используя нейросети и библиотеку OpenCV. Авторы столкнулись со сложностями при работе с монтажёрами, поэтому решили самостоятельно разработать решение, позволяющее автоматически заменять фон и добавлять необходимые эффекты. Начали с использования масок OpenCV для удаления зелёного фона, однако столкнулись с проблемами из-за шума и световых отражений.
Автоматизированный видеомонтаж с использованием нейросетей и OpenCV
Изображение носит иллюстративный характер

Для более качественного удаления фона была выбрана нейросеть Robust Video Matting (RVM), которая эффективно отделяет передний план от фона, учитывая временную последовательность кадров. RVM использует архитектуру кодера-декодера с рекуррентным декодером ConvGRU для сохранения информации о предыдущих кадрах. При этом, перед подачей видео в RVM, ролик обрабатывался OpenCV для удаления шума, увеличения насыщенности и подготовки фона. Затем была выполнена синхронизация FPS основного и фонового видео.

Также была реализована замена синего экрана телефона с помощью маски, а также эффект зума для привлечения внимания к элементам. Для поиска элементов на кадре, использовался поиск шаблонов OpenCV, но с предварительной обработкой кадра для уменьшения шумов. Для улучшения стабильности поиска, применялся не только поиск шаблона, но и поиск областей, похожих по цвету. Кроме того, для акцентирования внимания на найденных элементах был применен эффект зума с одновременным затемнением кадра. В финале добавлялись субтитры с помощью whisperx, звук с помощью модели silero и все это монтировалось с помощью FFMPEG.


Новое на сайте

19989Шесть историй, которые умещаются на ладони 19986Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров? 19985LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы 19984Автономная проверка защиты: как не отстать от ИИ-атак 19983Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по... 19982Почему почти 3000 монет в норвежском поле перевернули представление о викингах? 19981Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту? 19980Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля 19979Как хакеры грабят компании через звонок в «техподдержку» 19978Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед... 19977Как одна команда git push открывала доступ к миллионам репозиториев 19976Зачем древние народы убивали ножами и мечами: оружие как основа власти 19975Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно? 19974Послание в бутылке: математика невозможного 19973Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?
Ссылка