Как новая система SPSIM видит мир в 3D с одного кадра?

Получение точных трехмерных деталей объектов с помощью одной камеры представляет собой серьезную техническую проблему. Традиционные подходы часто требуют сложных установок с двумя камерами или специфических условий освещения, что делает их непрактичными для многих реальных сценариев использования.
Как новая система SPSIM видит мир в 3D с одного кадра?
Изображение носит иллюстративный характер

Исследователи из Нанкинского университета разработали прорывную систему стереоскопической поляризационной визуализации моментального снимка (SPSIM), предлагающую новый подход к 3D-изображениям. Эта разработка, представленная в журнале Optica и освещенная на платформе Science X Dialog, объединяет метаповерхностную оптику и искусственный интеллект (ИИ) для извлечения высокодетализированной информации о 3D-форме объектов в реальном времени.

Система SPSIM способна захватывать полные данные о поляризации по Стоксу за один кадр. Это достигается с помощью специально разработанной метаповерхностной линзы, показанной на схеме системы (Рис. 1). Такой подход устраняет необходимость в использовании нескольких поляризаторов или последовательных экспозиций, характерных для обычных методов поляризационной съемки.

Ключевым элементом системы является крупномасштабная поляризационная метаповерхность размером 1.65 × 1.65 мм². Эта метаповерхность (показана на Рис. 2) продемонстрировала коэффициент экстинкции 25 дБ, сравнимый с коммерческими поляризаторами, и беспрецедентную эффективность на центральной длине волны в 65%. Эксперименты подтвердили, что метаповерхность успешно разделяет шесть различных состояний поляризации падающего света, направляя каждый поляризационный компонент в заданную позицию на детекторе. Результаты моделирования полностью совпали с экспериментальными данными, подтверждая высокую производительность в узкополосных условиях.

Обработка захваченных данных осуществляется с помощью нейросетевого конвейера. Важнейшим аспектом является использование данных о круговой поляризации (CP), что значительно повышает точность определения нормалей к поверхности. Система достигает точности определения глубины в пределах 0.15 мм.

Процесс обработки включает предварительный этап для получения однозначных значений зенитного угла (ϑ) и азимутального угла (𝜓) (иллюстрация на Рис. 3). Первичная оценка глубины выполняется с использованием измеренных полных параметров Стокса (FSP), угла поляризации (AOP) и степени поляризации (DOP).

Одной из проблем при реконструкции является неоднозначность азимутального угла (𝜓). Для ее решения используется подход «форма из затенения» (shape-from-shading, SFS) в качестве физического априорного знания. Кроме того, применяется улучшенная модель нейронной сети U-Net, обученная на данных FSP и априорной информации, для высокоточного восстановления нормалей к поверхности.

Эффективность SPSIM была подтверждена в ходе реальных испытаний. Качественный и количественный анализ карт нормалей к поверхности (примеры на Рис. 4a) для тестовых объектов, таких как бутылки и чашки из полимерных материалов, показал высокую чувствительность системы к мелким деталям, которые трудноразличимы для традиционных камер или человеческого глаза при естественном освещении.

Сравнение показало, что нейросетевой подход, используемый в SPSIM, значительно снижает ошибки реконструкции на гладких поверхностях по сравнению с традиционными методами. Эксперименты однозначно подтвердили критическую роль данных о круговой поляризации (CP) для восстановления формы. CP позволяет точно фиксировать тонкие изменения контуров, тогда как ее исключение приводит к значительным ошибкам и потере деталей (сравнение на Рис. 4b и 4c).

Система также продемонстрировала возможность реконструкции полной 3D-текстуры объекта. Это достигается путем съемки объекта с нескольких ракурсов и последующего объединения полученных облаков точек (результат показан на Рис. 5).

Разработка SPSIM представляет собой значительный шаг вперед в области 3D-визуализации высокого разрешения. Компактный и эффективный дизайн системы позволяет осуществлять 3D-реконструкцию поверхности в реальном времени, даже в экстремальных условиях, и делает технологию пригодной для интеграции в портативные устройства.

Потенциальные области применения SPSIM включают дополненную реальность (AR), роботизированное зрение, технологии визуализации следующего поколения, биомедицинскую визуализацию, промышленный контроль и автономные системы.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка