Ssylka

Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?

Class Activation Maps (CAM) позволяют понять, какие области изображения наиболее важны для модели при принятии решения, показывая, какие признаки извлекает модель на разных слоях свертки и как они влияют на прогноз конкретного класса. CAM можно реализовать вручную для задач классификации, используя сверточные нейросети.
Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?
Изображение носит иллюстративный характер

Архитектура YOLO NAS включает backbone, neck и head. Backbone извлекает признаки, neck передает их, а head принимает решение о классификации и локализации объекта. CAM строится на головах, так как оттуда можно извлечь веса, влияющие на прогноз. На backbone визуализируют активации. Для извлечения данных используют hook-методы PyTorch, «подключаясь» к слоям сети. При инференсе необходимо установить fuse_model=False, иначе информативность карт снижается.

Анализ показал, что с увеличением номера stage (уровня свертки) модель анализирует более крупные области. Медианные значения активаций различаются на ранних этапах, но стабилизируются на уровне голов. Локализация усиливается с увеличением номера головы, так как более поздние головы используют выходы более поздних stages, фокусируясь на более специфичных признаках.

CAM помогает визуализировать влияние входных данных на прогноз модели на каждом уровне архитектуры, глубже понять работу архитектуры и оценить стабильность модели. Анализ стабильности помогает выявить чувствительность модели к шуму и искажениям, повышая надежность моделей в реальных условиях.


Новое на сайте

16943От сада чудес до протеина из атмосферы 16942Кратковременный сон наяву: научное объяснение пустоты в мыслях 16941Спутники Starlink создают непреднамеренную угрозу для радиоастрономии 16940Аутентификационная чума: бэкдор Plague год оставался невидимым 16939Фиолетовый страж тайских лесов: редкий краб-принцесса явился миру 16938Хроники мангровых лесов: победители фотоконкурса 2025 года 16937Танцевали ли планеты солнечной системы идеальный вальс? 16936Ай-ай: причудливый лемур, проклятый своим пальцем 16935Как рентгеновское зрение раскрывает самые бурные процессы во вселенной? 16934Уязвимость нулевого дня в SonicWall VPN стала оружием группировки Akira 16933Может ли государственный фонд единолично решать судьбу американской науки? 16932Способна ли филантропия блогеров решить мировой водный кризис? 16931Взлом через промпт: как AI-редактор Cursor превращали в оружие 16930Мог ли древний кризис заставить людей хоронить мертвых в печах с собаками? 16929Какие наушники Bose выбрать на распродаже: для полной изоляции или контроля над...