Ssylka

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Компания Alibaba представила Qwen 2.5-VL – мультимодальную модель ИИ, способную анализировать изображения и документы для генерации кода, в том числе для разметки объектов. Модель маркирует изображения ограничительными рамками, создавая JSON-файлы, и может «понимать» события на видео продолжительностью более часа.
ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК
Изображение носит иллюстративный характер

Qwen 2.5-VL способна преобразовывать документы в HTML-страницы, облегчая веб-разработку. Кроме того, она может действовать как ИИ-агент, управляя приложениями на ПК и мобильных устройствах от имени пользователя, выполняя задачи вроде бронирования авиабилетов. Исходный код и файлы для запуска агента доступны для скачивания.

Особое внимание стоит уделить возможности Qwen 2.5-VL генерировать не только код, но и обучающие данные. Разметка изображений рамками и пояснениями позволяет использовать ее для обучения других моделей. Это расширяет возможности применения ИИ в сфере машинного зрения и обработки данных.

В дополнение к Qwen 2.5-VL, Alibaba Cloud ранее выпустила модель QwQ-32B-Preview с возможностью рассуждений, которая по некоторым тестам превосходит конкурентов. Для работы с моделями Qwen также запущен отдельный сайт с чат-ботом, предоставляющий бесплатный доступ к функциям генерации текста, изображений и видео.


Новое на сайте

17900Сможет ли закон догнать искусственный интеллект, предлагающий психотерапию? 17899Цепная реакция заражения листерией из-за одного поставщика 17898Холодный расчет: как современная наука изменила правила стирки 17897Деревянная начинка: массовый отзыв корн-догов из-за угрозы травм 17896Случайное открытие, спасшее 500 миллионов жизней 17895Мастерство мобильной съемки: полное руководство по камере iPhone 17894Что мог рассказать личный набор инструментов охотника эпохи палеолита? 17893Почему крупнейшая звездная колыбель млечного пути производит непропорционально много... 17892Обречены ли мы есть инжир с мертвыми осами внутри? 17891Почему AI-помощникам выгодно лгать, а не признавать незнание? 17890Является ли творчество искусственного интеллекта предсказуемым недостатком? 17889Как каланы цепляются за надежду? 17888Расшифрованный код древнего Египта 17887Звук без компромиссов: выбор лучших активных полочных колонок 2025 года