Ssylka

Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?

Class Activation Maps (CAM) позволяют понять, какие области изображения наиболее важны для модели при принятии решения, показывая, какие признаки извлекает модель на разных слоях свертки и как они влияют на прогноз конкретного класса. CAM можно реализовать вручную для задач классификации, используя сверточные нейросети.
Как визуализировать, что именно видит нейросеть YOLO NAS S при распознавании объектов?
Изображение носит иллюстративный характер

Архитектура YOLO NAS включает backbone, neck и head. Backbone извлекает признаки, neck передает их, а head принимает решение о классификации и локализации объекта. CAM строится на головах, так как оттуда можно извлечь веса, влияющие на прогноз. На backbone визуализируют активации. Для извлечения данных используют hook-методы PyTorch, «подключаясь» к слоям сети. При инференсе необходимо установить fuse_model=False, иначе информативность карт снижается.

Анализ показал, что с увеличением номера stage (уровня свертки) модель анализирует более крупные области. Медианные значения активаций различаются на ранних этапах, но стабилизируются на уровне голов. Локализация усиливается с увеличением номера головы, так как более поздние головы используют выходы более поздних stages, фокусируясь на более специфичных признаках.

CAM помогает визуализировать влияние входных данных на прогноз модели на каждом уровне архитектуры, глубже понять работу архитектуры и оценить стабильность модели. Анализ стабильности помогает выявить чувствительность модели к шуму и искажениям, повышая надежность моделей в реальных условиях.


Новое на сайте

18200Вебхуки Discord и поддельные собеседования как оружие в атаках на разработчиков 18199Древнее искусство подделки как оружие против современных фейков 18198Действительно ли новый успех Starship открывает путь на луну и Марс? 18197Синхронизированные мегаземлетрясения: скрытая связь разломов Каскадия и Сан-Андреас 18196Могут ли гигантские фрагменты днк во рту предсказывать рак? 18195В солнечной системе может скрываться неизвестная планета земного типа 18194Почему крупнейший банк Америки вкладывает триллионы в национальную безопасность? 18193Обеспечит ли партнерство с Broadcom будущее искусственного интеллекта OpenAI? 18192Раскрыл ли искусственный интеллект истинную угрозу флегрейских полей? 18191Почему меньший урожай кукурузы оказался питательнее для выживания? 18190Космическая завеса: как «Джеймс Уэбб» раскрыл тайну исчезающих звезд-гигантов 18189Ледяной цунами на реке Тахини: двойная роль катастрофы 18188Можно ли напечатать кукурузный лабиринт, как на струйном принтере? 18187Какие продукты и добавки эффективнее общей диеты с высоким содержанием клетчатки? 18186Почему римляне напоминали о смерти во время пира?