Меню

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Жак-Жан

Компания Alibaba представила Qwen 2.5-VL – мультимодальную модель ИИ, способную анализировать изображения и документы для генерации кода, в том числе для разметки объектов. Модель маркирует изображения ограничительными рамками, создавая JSON-файлы, и может «понимать» события на видео продолжительностью более часа.
ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

ИИ-модель Alibaba Qwen: от картинок к коду и управлению ПК

Изображение носит иллюстративный характер

Qwen 2.5-VL способна преобразовывать документы в HTML-страницы, облегчая веб-разработку. Кроме того, она может действовать как ИИ-агент, управляя приложениями на ПК и мобильных устройствах от имени пользователя, выполняя задачи вроде бронирования авиабилетов. Исходный код и файлы для запуска агента доступны для скачивания.

Особое внимание стоит уделить возможности Qwen 2.5-VL генерировать не только код, но и обучающие данные. Разметка изображений рамками и пояснениями позволяет использовать ее для обучения других моделей. Это расширяет возможности применения ИИ в сфере машинного зрения и обработки данных.

В дополнение к Qwen 2.5-VL, Alibaba Cloud ранее выпустила модель QwQ-32B-Preview с возможностью рассуждений, которая по некоторым тестам превосходит конкурентов. Для работы с моделями Qwen также запущен отдельный сайт с чат-ботом, предоставляющий бесплатный доступ к функциям генерации текста, изображений и видео.

Источник: Ася Карпова

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Шесть историй, которые умещаются на ладони

Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров?

LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы

Автономная проверка защиты: как не отстать от ИИ-атак

Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по...

Почему почти 3000 монет в норвежском поле перевернули представление о викингах?

Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту?

Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля

Как хакеры грабят компании через звонок в «техподдержку»

Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед...

Как одна команда git push открывала доступ к миллионам репозиториев

Зачем древние народы убивали ножами и мечами: оружие как основа власти

Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно?

Послание в бутылке: математика невозможного

Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?

Меню

МенюЗакрыть