Ssylka

Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности

Фреймворк Simple получил значительное обновление в части компьютерного зрения (CV), где ActiveCV теперь является полноценным элементом экрана, подобно кнопке или надписи, что позволяет совмещать логику экранов и обработку видеопотока. ActiveCV представляет собой методологию автоматизации бизнес-процессов, при которой необходимые данные отображаются непосредственно в видеопотоке, с использованием различных детекторов (штрихкодов, OCR, лиц и др.), позволяя оператору работать непрерывно без переключения между экранами.
Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности
Изображение носит иллюстративный характер

Ключевым элементом ActiveCV является цветовая маркировка объектов, обеспечивающая быструю передачу информации оператору: зеленый цвет указывает на соответствие, красный – на несоответствие, желтый – на приближение к критическому значению, что оказалось более эффективным, чем текстовая информация. Новая версия ActiveCV включает возможность одновременного использования нескольких детекторов, их плавного переключения и настройки без перезагрузки камеры. Детекторы подключаются слоями и используют единый механизм датасетов для валидации и получения информации об объектах, что увеличивает скорость и снижает нагрузку на обработчики.

В обновленной версии ActiveCV внедрены новые возможности: пауза камеры, управление зумом, фонариком, а также гибкая настройка цветовой маркировки, выбор типа штрихкодов, и улучшенный OCR с Regex-масками, а также настраиваемая предобработка и постобработка, что позволило повысить производительность системы. Теперь компонент ActiveCV полностью заменяет экранные элементы Штрихкод, Фото и Распознавание текста. Примеры использования включают сбор остатков (с проверкой по базе), показ остатков на складе, проверку сроков годности товаров с использованием OCR для распознавания дат и штрихкодов.

Механизмы работы включают размещение элемента ActiveCV, настройку разрешения, управление циклом детекторов, отображение объектов с возможностью изменения их внешнего вида, ручное управление списком детектированных объектов, подключение валидаторов для всех типов детекторов, управление зумом, остановку видеопотока и работу с фонариком. Для штрихкодов можно задавать список поддерживаемых и текущих форматов. OCR поддерживает предобработку текста, Regex-маски и валидацию, обеспечивая гибкую и быструю обработку данных. Также добавлена возможность перерисовки контейнера без перезагрузки камеры, события по закрытию диалогов и работа с датасетами. В планах добавить рамки для «прицела» OCR, а также интеграцию OpenCV, PyTorch и моделей машинного обучения на Python.


Новое на сайте

17902Lufthansa заменит 4000 административных сотрудников искусственным интеллектом 17901Каков истинный срок годности генетической информации? 17900Сможет ли закон догнать искусственный интеллект, предлагающий психотерапию? 17899Цепная реакция заражения листерией из-за одного поставщика 17898Холодный расчет: как современная наука изменила правила стирки 17897Деревянная начинка: массовый отзыв корн-догов из-за угрозы травм 17896Случайное открытие, спасшее 500 миллионов жизней 17895Мастерство мобильной съемки: полное руководство по камере iPhone 17894Что мог рассказать личный набор инструментов охотника эпохи палеолита? 17893Почему крупнейшая звездная колыбель млечного пути производит непропорционально много... 17892Обречены ли мы есть инжир с мертвыми осами внутри? 17891Почему AI-помощникам выгодно лгать, а не признавать незнание? 17890Является ли творчество искусственного интеллекта предсказуемым недостатком? 17889Как каланы цепляются за надежду? 17888Расшифрованный код древнего Египта