Ssylka

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Компания Alibaba представила Qwen 2.5-VL – мультимодальную модель ИИ, способную анализировать изображения и документы для генерации кода, в том числе для разметки объектов. Модель маркирует изображения ограничительными рамками, создавая JSON-файлы, и может «понимать» события на видео продолжительностью более часа.
ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК
Изображение носит иллюстративный характер

Qwen 2.5-VL способна преобразовывать документы в HTML-страницы, облегчая веб-разработку. Кроме того, она может действовать как ИИ-агент, управляя приложениями на ПК и мобильных устройствах от имени пользователя, выполняя задачи вроде бронирования авиабилетов. Исходный код и файлы для запуска агента доступны для скачивания.

Особое внимание стоит уделить возможности Qwen 2.5-VL генерировать не только код, но и обучающие данные. Разметка изображений рамками и пояснениями позволяет использовать ее для обучения других моделей. Это расширяет возможности применения ИИ в сфере машинного зрения и обработки данных.

В дополнение к Qwen 2.5-VL, Alibaba Cloud ранее выпустила модель QwQ-32B-Preview с возможностью рассуждений, которая по некоторым тестам превосходит конкурентов. Для работы с моделями Qwen также запущен отдельный сайт с чат-ботом, предоставляющий бесплатный доступ к функциям генерации текста, изображений и видео.


Новое на сайте

7477Избавит ли Акаризакс от мучений аллергии на пылевых клещей? 7476Мог ли карманный ноутбук 1995 года конкурировать с современными устройствами? 7475Как выбрать инструменты для DevOps: комплексный подход? 7473Как ИИ может принести реальную пользу бизнесу и как не допустить катастрофы? 7472Многопёры: эволюционные загадки или живые свидетели древних морей? 7471Как эффективно отслеживать состояние системы с помощью Prometheus? 7470Как создать систему удаленного мониторинга климата без постоянной замены батареек? 7469Зачем нужны разные дизайн-системы и UI-киты в одной компании? 7468Последний аккорд «бэби гранд»: прощание с легендой музыкального Глазго 7467Может ли новый анализ ДНК предсказать рак кишечника у больных ВЗК с точностью 90%? 7466Смогут ли уличные музыканты спасти знаменитую ярмарку? 7465Какие штрафы за утечку данных грозят бизнесу в 2025? 7464Куда движется UX-дизайн: благо или упадок? 7463Возможно ли кодирование UTF-8 без условных переходов?