Ssylka

SAMURAI: эволюция zero-shot трекинга

Модель SAMURAI для визуального трекинга объектов представляет собой значительный шаг вперед по сравнению с предшествующими моделями SAM и SAM-2. SAM изначально предназначался для сегментации изображений на основе различных подсказок (текст, точки, bounding box, маски), а SAM-2 адаптировал эту архитектуру для видео, используя механизм памяти для отслеживания объектов во времени.
SAMURAI: эволюция zero-shot трекинга
Изображение носит иллюстративный характер

Основная инновация SAMURAI заключается в интеграции модели движения на основе фильтра Калмана, что значительно повышает точность отслеживания. Фильтр Калмана использует как предсказания модели, так и информацию о движении объекта, минимизируя влияние ошибок и неопределенности при отслеживании. Также введена система отбора кадров для памяти, которая отбрасывает кадры с плохим качеством.

SAMURAI использует оценку предсказанных масок с учетом их соответствия модели движения и уверенности в наличии объекта. Маска с наибольшим взвешенным скором на основе этих факторов выбирается для дальнейшего отслеживания. Усовершенствование памяти позволяет избегать накопления ошибок из-за хранения некачественных кадров, что было проблемой у SAM-2.

Благодаря этим улучшениям, SAMURAI демонстрирует высокую эффективность в задачах отслеживания объектов, особенно в сложных условиях с переполненными сценами, быстро движущимися объектами, и объектами, похожими друг на друга. Модель на основе фильтра Калмана и улучшенная память позволили достичь впечатляющих результатов в области zero-shot трекинга, что выводит ее на уровень конкурентоспособности с supervised-решениями.


Новое на сайте

18604Является ли рекордная скидка на Garmin Instinct 3 Solar лучшим предложением ноября? 18603Могла ли детская смесь ByHeart вызвать национальную вспышку ботулизма? 18602Готовы ли банки доверить агентскому ИИ управление деньгами клиентов? 18601Как сезонные ветры создают миллионы загадочных полос на Марсе? 18600Как тело человека превращается в почву за 90 дней? 18599Как ваш iPhone может заменить паспорт при внутренних перелетах по США? 18598Мозговой шторм: что происходит, когда мозг отключается от усталости 18597Раскрыта асимметричная форма рождения сверхновой 18596Скидки Ninja: как получить идеальную корочку и сэкономить на доставке 18595Почему работа на нескольких работах становится новой нормой? 18594Записная книжка против нейросети: ценность медленного мышления 18593Растущая брешь в магнитном щите земли 18592Каким образом блокчейн-транзакции стали новым инструментом для кражи криптовалюты? 18591Что скрывается за ростом прибыли The Walt Disney Company? 18590Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI?