Ssylka

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Компания Alibaba представила Qwen 2.5-VL – мультимодальную модель ИИ, способную анализировать изображения и документы для генерации кода, в том числе для разметки объектов. Модель маркирует изображения ограничительными рамками, создавая JSON-файлы, и может «понимать» события на видео продолжительностью более часа.
ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК
Изображение носит иллюстративный характер

Qwen 2.5-VL способна преобразовывать документы в HTML-страницы, облегчая веб-разработку. Кроме того, она может действовать как ИИ-агент, управляя приложениями на ПК и мобильных устройствах от имени пользователя, выполняя задачи вроде бронирования авиабилетов. Исходный код и файлы для запуска агента доступны для скачивания.

Особое внимание стоит уделить возможности Qwen 2.5-VL генерировать не только код, но и обучающие данные. Разметка изображений рамками и пояснениями позволяет использовать ее для обучения других моделей. Это расширяет возможности применения ИИ в сфере машинного зрения и обработки данных.

В дополнение к Qwen 2.5-VL, Alibaba Cloud ранее выпустила модель QwQ-32B-Preview с возможностью рассуждений, которая по некоторым тестам превосходит конкурентов. Для работы с моделями Qwen также запущен отдельный сайт с чат-ботом, предоставляющий бесплатный доступ к функциям генерации текста, изображений и видео.


Новое на сайте

19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению... 19017Вредоносная кампания в Chrome перехватывает управление HR-системами и блокирует... 19016Глубоководные оползни раскрыли историю мегаземлетрясений зоны Каскадия за 7500 лет 19015Насколько глубоки ваши познания об эволюции и происхождении человека? 19014Как уязвимость CodeBreach в AWS CodeBuild могла привести к глобальной атаке через ошибку... 19013Затерянный фрагмент древней плиты пионер меняет карту сейсмических угроз Калифорнии 19012Генетические мутации вызывают слепоту менее чем в 30% случаев вопреки прежним прогнозам 19011Завершено строительство космического телескопа Nancy Grace Roman для поиска ста тысяч... 19010Вязкость пространства и фононы вакуума как разгадка аномалий расширения вселенной 19009Приведет ли массовое плодоношение дерева Риму к рекордному росту популяции какапо? 19008Как уязвимость CVE-2026-23550 в плагине Modular DS позволяет захватить управление сайтом? 19007Может ли уличная драка французского авантюриста раскрыть кризис американского гражданства... 19006Может ли один клик по легитимной ссылке заставить Microsoft Copilot и другие ИИ тайно... 19005Утрата истинного мастерства в эпоху алгоритмов и скрытые механизмы человеческого...