Искусственный интеллект научил роботов физическому самосознанию

Ученые из Массачусетского технологического института (MIT) создали систему искусственного интеллекта, которая позволяет роботам самостоятельно обучаться движению. Система работает, наблюдая за действиями робота через камеру, что аналогично тому, как люди учатся контролировать собственное тело. Такой подход исключает необходимость в дорогостоящих датчиках, предварительном обучении на протяжении тысяч часов или ручном программировании.
Искусственный интеллект научил роботов физическому самосознанию
Изображение носит иллюстративный характер

Ключевой технологией, представленной аспирантом Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL) Сизхе Лестером Ли, является новый метод управления, названный «визуомоторное поле Якобиана». Эта система напрямую сопоставляет видеопоток с видимыми 3D-точками на теле робота с его исполнительными механизмами (приводами). В результате ИИ получает возможность с высокой точностью прогнозировать движения на основе исключительно визуальных данных.

Процесс обучения имитирует человеческий опыт. Робот выполняет случайные действия, а система наблюдает за результатами через камеры и корректирует свою модель управления. Для первоначальной разработки фреймворка потребовалось всего от двух до трех часов видеозаписей, сделанных с помощью 12 бытовых RGB-D видеокамер. На этих записях робот выполнял случайно сгенерированные команды.

Архитектура системы состоит из двух основных компонентов. Первый — это модель глубокого обучения, которая позволяет роботу понимать свое физическое положение и расположение конечностей в трехмерном пространстве. Она прогнозирует, как изменится позиция робота после выполнения команды. Второй компонент — программа машинного обучения, которая переводит общие команды движения в специфический код, понятный для аппаратного обеспечения конкретного робота.

Этот подход является решением проблем традиционной робототехники. Стандартные методы полагаются на прецизионную инженерию, точные спецификации, дорогие датчики и предварительно обученные модели ИИ, требующие от сотен до тысяч часов тонкой настройки. Они также испытывают трудности со сложными задачами, такими как захват объектов с помощью манипуляторов, подобных руке.

Новая система MIT предлагает низкозатратное и универсальное решение. Она может управлять практически любой архитектурой роботов, включая «мягкую робототехнику» и машины из гибких материалов. Вместо дорогих сенсоров используются обычные камеры, а для достижения автономии роботу требуется всего несколько часов обучения.

После первоначальной настройки система не требует дальнейшего вмешательства человека. Робот может продолжать свою работу автономно, используя для навигации и управления всего одну видеокамеру. Это обеспечивает высокоточное решение для автоматизации роботизированных систем в различных отраслях.

В ходе сравнительных тестов система на основе «поля Якобиана» была сопоставлена с традиционными методами управления, использующими 2D-камеры. Разработка MIT превзошла существующие системы по точности. Особенно высокие результаты были показаны в условиях частичной блокировки обзора, когда часть робота была скрыта от камеры.

При возникновении визуальных препятствий старые методы контроля переходили в состояние сбоя. В то же время система MIT успешно продолжала работу, создавая навигационные 3D-карты окружения даже при наличии случайных помех. Исследование с подробным описанием технологии и результатов было опубликовано 25 июня в журнале Nature.


Новое на сайте

19212Архитектура смыслов в профессиональной редактуре 19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса
Ссылка