Ssylka

Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности

Фреймворк Simple получил значительное обновление в части компьютерного зрения (CV), где ActiveCV теперь является полноценным элементом экрана, подобно кнопке или надписи, что позволяет совмещать логику экранов и обработку видеопотока. ActiveCV представляет собой методологию автоматизации бизнес-процессов, при которой необходимые данные отображаются непосредственно в видеопотоке, с использованием различных детекторов (штрихкодов, OCR, лиц и др.), позволяя оператору работать непрерывно без переключения между экранами.
Интеграция компьютерного зрения в Android-фреймворке Simple: новые возможности
Изображение носит иллюстративный характер

Ключевым элементом ActiveCV является цветовая маркировка объектов, обеспечивающая быструю передачу информации оператору: зеленый цвет указывает на соответствие, красный – на несоответствие, желтый – на приближение к критическому значению, что оказалось более эффективным, чем текстовая информация. Новая версия ActiveCV включает возможность одновременного использования нескольких детекторов, их плавного переключения и настройки без перезагрузки камеры. Детекторы подключаются слоями и используют единый механизм датасетов для валидации и получения информации об объектах, что увеличивает скорость и снижает нагрузку на обработчики.

В обновленной версии ActiveCV внедрены новые возможности: пауза камеры, управление зумом, фонариком, а также гибкая настройка цветовой маркировки, выбор типа штрихкодов, и улучшенный OCR с Regex-масками, а также настраиваемая предобработка и постобработка, что позволило повысить производительность системы. Теперь компонент ActiveCV полностью заменяет экранные элементы Штрихкод, Фото и Распознавание текста. Примеры использования включают сбор остатков (с проверкой по базе), показ остатков на складе, проверку сроков годности товаров с использованием OCR для распознавания дат и штрихкодов.

Механизмы работы включают размещение элемента ActiveCV, настройку разрешения, управление циклом детекторов, отображение объектов с возможностью изменения их внешнего вида, ручное управление списком детектированных объектов, подключение валидаторов для всех типов детекторов, управление зумом, остановку видеопотока и работу с фонариком. Для штрихкодов можно задавать список поддерживаемых и текущих форматов. OCR поддерживает предобработку текста, Regex-маски и валидацию, обеспечивая гибкую и быструю обработку данных. Также добавлена возможность перерисовки контейнера без перезагрузки камеры, события по закрытию диалогов и работа с датасетами. В планах добавить рамки для «прицела» OCR, а также интеграцию OpenCV, PyTorch и моделей машинного обучения на Python.


Новое на сайте

18604Является ли рекордная скидка на Garmin Instinct 3 Solar лучшим предложением ноября? 18603Могла ли детская смесь ByHeart вызвать национальную вспышку ботулизма? 18602Готовы ли банки доверить агентскому ИИ управление деньгами клиентов? 18601Как сезонные ветры создают миллионы загадочных полос на Марсе? 18600Как тело человека превращается в почву за 90 дней? 18599Как ваш iPhone может заменить паспорт при внутренних перелетах по США? 18598Мозговой шторм: что происходит, когда мозг отключается от усталости 18597Раскрыта асимметричная форма рождения сверхновой 18596Скидки Ninja: как получить идеальную корочку и сэкономить на доставке 18595Почему работа на нескольких работах становится новой нормой? 18594Записная книжка против нейросети: ценность медленного мышления 18593Растущая брешь в магнитном щите земли 18592Каким образом блокчейн-транзакции стали новым инструментом для кражи криптовалюты? 18591Что скрывается за ростом прибыли The Walt Disney Company? 18590Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI?