Ssylka

Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?

Class Activation Maps (CAM) позволяют понять, какие области изображения наиболее важны для модели при принятии решения, показывая, какие признаки извлекает модель на разных слоях свертки и как они влияют на прогноз конкретного класса. CAM можно реализовать вручную для задач классификации, используя сверточные нейросети.
Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?
Изображение носит иллюстративный характер

Архитектура YOLO NAS включает backbone, neck и head. Backbone извлекает признаки, neck передает их, а head принимает решение о классификации и локализации объекта. CAM строится на головах, так как оттуда можно извлечь веса, влияющие на прогноз. На backbone визуализируют активации. Для извлечения данных используют hook-методы PyTorch, «подключаясь» к слоям сети. При инференсе необходимо установить fuse_model=False, иначе информативность карт снижается.

Анализ показал, что с увеличением номера stage (уровня свертки) модель анализирует более крупные области. Медианные значения активаций различаются на ранних этапах, но стабилизируются на уровне голов. Локализация усиливается с увеличением номера головы, так как более поздние головы используют выходы более поздних stages, фокусируясь на более специфичных признаках.

CAM помогает визуализировать влияние входных данных на прогноз модели на каждом уровне архитектуры, глубже понять работу архитектуры и оценить стабильность модели. Анализ стабильности помогает выявить чувствительность модели к шуму и искажениям, повышая надежность моделей в реальных условиях.


Новое на сайте

18590Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI? 18589Как Operation Endgame нанесла сокрушительный удар по глобальной киберпреступности? 18588Кибервойна на скорости машин: почему защита должна стать автоматической к 2026 году 18587Как одна ошибка в коде открыла для хакеров 54 000 файрволов WatchGuard? 18586Криптовалютный червь: как десятки тысяч фейковых пакетов наводнили npm 18585Портативный звук JBL по рекордно низкой цене 18584Воин-крокодил триаса: находка в Бразилии связала континенты 18583Опиум как повседневность древнего Египта 18582Двойной удар по лекарственно-устойчивой малярии 18581Почему взрыв массивной звезды асимметричен в первые мгновения? 18580Почему самые удобные для поиска жизни звезды оказались наиболее враждебными? 18579Смертоносные вспышки красных карликов угрожают обитаемым мирам 18578Почему самый активный подводный вулкан тихого океана заставил ученых пересмотреть дату... 18577Вспышка на солнце сорвала запуск ракеты New Glenn к Марсу 18576Как фишинг-платформа Lighthouse заработала миллиард долларов и почему Google подала на...