Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?

Class Activation Maps (CAM) позволяют понять, какие области изображения наиболее важны для модели при принятии решения, показывая, какие признаки извлекает модель на разных слоях свертки и как они влияют на прогноз конкретного класса. CAM можно реализовать вручную для задач классификации, используя сверточные нейросети.
Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?
Изображение носит иллюстративный характер

Архитектура YOLO NAS включает backbone, neck и head. Backbone извлекает признаки, neck передает их, а head принимает решение о классификации и локализации объекта. CAM строится на головах, так как оттуда можно извлечь веса, влияющие на прогноз. На backbone визуализируют активации. Для извлечения данных используют hook-методы PyTorch, «подключаясь» к слоям сети. При инференсе необходимо установить fuse_model=False, иначе информативность карт снижается.

Анализ показал, что с увеличением номера stage (уровня свертки) модель анализирует более крупные области. Медианные значения активаций различаются на ранних этапах, но стабилизируются на уровне голов. Локализация усиливается с увеличением номера головы, так как более поздние головы используют выходы более поздних stages, фокусируясь на более специфичных признаках.

CAM помогает визуализировать влияние входных данных на прогноз модели на каждом уровне архитектуры, глубже понять работу архитектуры и оценить стабильность модели. Анализ стабильности помогает выявить чувствительность модели к шуму и искажениям, повышая надежность моделей в реальных условиях.


Новое на сайте

19521Банковский троян VENON на Rust атакует Бразилию с помощью девяти техник обхода защиты 19520Бонобо агрессивны не меньше шимпанзе, но всё решают самки 19519Почему 600-килограммовый зонд NASA падает на Землю из-за солнечной активности? 19518«Липовый календарь»: как расписание превращает работников в расходный материал 19517Вредоносные Rust-пакеты и ИИ-бот крадут секреты разработчиков через CI/CD-пайплайны 19516Как хакеры за 72 часа превратили npm-пакет в ключ от целого облака AWS 19515Как WebDAV-диск и поддельная капча помогают обойти антивирус? 19514Могут ли простые числа скрываться внутри чёрных дыр? 19513Метеорит пробил крышу дома в Германии — откуда взялся огненный шар над Европой? 19512Уязвимости LeakyLooker в Google Looker Studio открывали доступ к чужим базам данных 19511Почему тысячи серверов оказываются открытой дверью для хакеров, хотя могли бы ею не быть? 19510Как исследователи за четыре минуты заставили ИИ-браузер Perplexity Comet попасться на... 19509Может ли женщина без влагалища и шейки матки зачать ребёнка естественным путём? 19508Зачем учёные из Вены создали QR-код, который невозможно увидеть без электронного... 19507Девять уязвимостей CrackArmor позволяют получить root-доступ через модуль безопасности...
Ссылка