Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI?

Исследователи из AI-стартапа Pathway разработали новую архитектуру искусственного интеллекта под названием «Dragon Hatchling». Они заявляют, что это первая модель, способная к «обобщению во времени» путем постоянной адаптации своей внутренней структуры в ответ на новую информацию, что потенциально является «недостающим звеном» на пути к достижению Общего Искусственного Интеллекта (AGI).
Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI?
Изображение носит иллюстративный характер

Основная цель архитектуры — преодолеть разрыв между существующим ИИ и более человекоподобным познанием. Ключевая особенность «Dragon Hatchling» заключается в его способности автоматически корректировать свои собственные нейронные связи в режиме реального времени по мере обработки новой информации. Модель имитирует то, как нейроны в человеческом мозге соединяются и укрепляются благодаря накопленному опыту.

В отличие от последовательной, многоуровневой структуры традиционных трансформеров, «Dragon Hatchling» описывается как «гибкая сеть», которая реорганизует саму себя. Она использует крошечные «нейронные частицы», которые непрерывно обмениваются информацией. Эти частицы корректируют свои связи, усиливая одни и ослабляя другие, тем самым формируя новые пути по мере обучения модели.

Эта архитектурная особенность позволяет «Dragon Hatchling» развивать форму кратковременной памяти за счет постоянных структурных адаптаций. Это кардинально отличает его от традиционных больших языковых моделей (LLM), чья «память» происходит из сохраненного контекста в их обучающих данных.

Современные модели ИИ, такие как ChatGPT, Google Gemini и Claude, основаны на технологии трансформеров — фреймворке глубокого обучения, который позволяет ИИ устанавливать связи между словами и идеями. Однако их фундаментальным ограничением является статичное обучение. После того как LLM обучена, ее управляющие параметры становятся заблокированными. Для получения новых знаний требуется ресурсоемкое переобучение или донастройка.

Эдриан Косовски, сооснователь и главный научный сотрудник Pathway, в подкасте SuperDataScience 7 октября заявил, что существующие модели ИИ «не обобщают рассуждения так, как это делают люди». Они с трудом применяют логику за пределами шаблонов, увиденных в данных для обучения. Человеческое мышление описывается как «хаотичное сплетение» пересекающихся мыслей и информации, а не аккуратная линейная последовательность, которую текущие модели не могут воспроизвести.

Исследователи предполагают, что их модель может стать тем самым «недостающим звеном» между сегодняшним ИИ и более продвинутым интеллектом, вдохновленным работой мозга. Эта архитектура предлагается как решение проблемы обобщения рассуждений на более сложные и длинные паттерны, что является ключевым препятствием в области ИИ. Разработка позиционируется как фундаментальный шаг к созданию Общего Искусственного Интеллекта.

Теоретически, такая архитектура может привести к созданию моделей ИИ, которые становятся умнее по мере того, как дольше находятся в рабочем состоянии, обучаясь и адаптируясь автономно.

Исследование с описанием архитектуры было загружено 30 сентября в базу препринтов arXiv. Важно отметить, что на данный момент работа еще не прошла процедуру рецензирования научным сообществом.

В ходе тестов «Dragon Hatchling» показал производительность, сопоставимую с моделью GPT-2, в эталонных задачах языкового моделирования и перевода. Команда Pathway считает это «впечатляющим достижением для совершенно новой, прототипной архитектуры».


Новое на сайте

19819Темнота быстрее света, толстеющие медведи и боль омаров 19818Китайские фотографы, придумавшие визуальный образ Индонезии 19817В Луксоре нашли стелу с римским императором в образе фараона 19816Экипаж Artemis II о моменте, когда земля исчезла за луной 19815Почему Луна выглядит по-разному в разных точках Земли? 19814Adobe экстренно закрыла опасную дыру в Acrobat Reader, которую хакеры использовали с... 19813Метеорный поток, рождённый из умирающего астероида 19812Когда робот пишет за тебя прощальную смс 19811Что общего у лунной миссии, толстого попугая, загадочной плащаницы и лекарства от диабета? 19810Какие снимки Artemis II уже стали иконами лунной программы? 19809Кто на самом деле хочет сладкого — вы или ваши бактерии? 19808Как рекламные данные 500 миллионов телефонов оказались в руках спецслужб? 19807Экипаж Artemis II вернулся на землю после десяти дней в космосе 19806Зелёная и коричневая луна: почему геологи Artemis II уже не могут усидеть на месте 19805Эксперты уверены в теплозащитном щите Artemis II, несмотря на проблемы предшественника
Ссылка