Ssylka

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Компания Alibaba представила Qwen 2.5-VL – мультимодальную модель ИИ, способную анализировать изображения и документы для генерации кода, в том числе для разметки объектов. Модель маркирует изображения ограничительными рамками, создавая JSON-файлы, и может «понимать» события на видео продолжительностью более часа.
ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК
Изображение носит иллюстративный характер

Qwen 2.5-VL способна преобразовывать документы в HTML-страницы, облегчая веб-разработку. Кроме того, она может действовать как ИИ-агент, управляя приложениями на ПК и мобильных устройствах от имени пользователя, выполняя задачи вроде бронирования авиабилетов. Исходный код и файлы для запуска агента доступны для скачивания.

Особое внимание стоит уделить возможности Qwen 2.5-VL генерировать не только код, но и обучающие данные. Разметка изображений рамками и пояснениями позволяет использовать ее для обучения других моделей. Это расширяет возможности применения ИИ в сфере машинного зрения и обработки данных.

В дополнение к Qwen 2.5-VL, Alibaba Cloud ранее выпустила модель QwQ-32B-Preview с возможностью рассуждений, которая по некоторым тестам превосходит конкурентов. Для работы с моделями Qwen также запущен отдельный сайт с чат-ботом, предоставляющий бесплатный доступ к функциям генерации текста, изображений и видео.


Новое на сайте

18884Знаете ли вы, что приматы появились до вымирания динозавров, и готовы ли проверить свои... 18883Четыреста колец в туманности эмбрион раскрыли тридцатилетнюю тайну звездной эволюции 18882Телескоп Джеймс Уэбб раскрыл тайны сверхэффективной звездной фабрики стрелец B2 18881Математический анализ истинного количества сквозных отверстий в человеческом теле 18880Почему даже элитные суперраспознаватели проваливают тесты на выявление дипфейков без... 18879Шесть легендарных древних городов и столиц империй, местоположение которых до сих пор... 18878Обзор самых необычных медицинских диагнозов и клинических случаев 2025 года 18877Критическая уязвимость CVE-2025-14847 в MongoDB открывает удаленный доступ к памяти... 18876Научное обоснование классификации солнца как желтого карлика класса G2V 18875Как безграничная преданность горным гориллам привела Дайан Фосси к жестокой гибели? 18874Новый родственник спинозавра из Таиланда меняет представления об эволюции хищников Азии 18873Как новая электрохимическая технология позволяет удвоить добычу водорода и снизить... 18872Могут ли ледяные гиганты Уран и Нептун на самом деле оказаться каменными? 18871Внедрение вредоносного кода в расширение Trust Wallet привело к хищению 7 миллионов... 18870Проверка клинического мышления на основе редких медицинских случаев 2025 года