Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности

Фреймворк Simple получил значительное обновление в части компьютерного зрения (CV), где ActiveCV теперь является полноценным элементом экрана, подобно кнопке или надписи, что позволяет совмещать логику экранов и обработку видеопотока. ActiveCV представляет собой методологию автоматизации бизнес-процессов, при которой необходимые данные отображаются непосредственно в видеопотоке, с использованием различных детекторов (штрихкодов, OCR, лиц и др.), позволяя оператору работать непрерывно без переключения между экранами.
Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности
Изображение носит иллюстративный характер

Ключевым элементом ActiveCV является цветовая маркировка объектов, обеспечивающая быструю передачу информации оператору: зеленый цвет указывает на соответствие, красный – на несоответствие, желтый – на приближение к критическому значению, что оказалось более эффективным, чем текстовая информация. Новая версия ActiveCV включает возможность одновременного использования нескольких детекторов, их плавного переключения и настройки без перезагрузки камеры. Детекторы подключаются слоями и используют единый механизм датасетов для валидации и получения информации об объектах, что увеличивает скорость и снижает нагрузку на обработчики.

В обновленной версии ActiveCV внедрены новые возможности: пауза камеры, управление зумом, фонариком, а также гибкая настройка цветовой маркировки, выбор типа штрихкодов, и улучшенный OCR с Regex-масками, а также настраиваемая предобработка и постобработка, что позволило повысить производительность системы. Теперь компонент ActiveCV полностью заменяет экранные элементы Штрихкод, Фото и Распознавание текста. Примеры использования включают сбор остатков (с проверкой по базе), показ остатков на складе, проверку сроков годности товаров с использованием OCR для распознавания дат и штрихкодов.

Механизмы работы включают размещение элемента ActiveCV, настройку разрешения, управление циклом детекторов, отображение объектов с возможностью изменения их внешнего вида, ручное управление списком детектированных объектов, подключение валидаторов для всех типов детекторов, управление зумом, остановку видеопотока и работу с фонариком. Для штрихкодов можно задавать список поддерживаемых и текущих форматов. OCR поддерживает предобработку текста, Regex-маски и валидацию, обеспечивая гибкую и быструю обработку данных. Также добавлена возможность перерисовки контейнера без перезагрузки камеры, события по закрытию диалогов и работа с датасетами. В планах добавить рамки для «прицела» OCR, а также интеграцию OpenCV, PyTorch и моделей машинного обучения на Python.


Новое на сайте

19989Шесть историй, которые умещаются на ладони 19986Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров? 19985LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы 19984Автономная проверка защиты: как не отстать от ИИ-атак 19983Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по... 19982Почему почти 3000 монет в норвежском поле перевернули представление о викингах? 19981Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту? 19980Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля 19979Как хакеры грабят компании через звонок в «техподдержку» 19978Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед... 19977Как одна команда git push открывала доступ к миллионам репозиториев 19976Зачем древние народы убивали ножами и мечами: оружие как основа власти 19975Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно? 19974Послание в бутылке: математика невозможного 19973Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?
Ссылка