Прорыв в прогнозировании новых материалов: E2T расширяет возможности искусственного интеллекта

В феврале 2025 года в журнале Communications Materials опубликованы результаты исследования, проведённого Коэи Нода из JSR Corporation и профессором Рё Ёсидой из Института статистической математики. Учёные представили новый алгоритм E2T (Extrapolative Episodic Training), способный совершать экстраполятивные прогнозы свойств материалов, выходя за рамки существующих данных.
Прорыв в прогнозировании новых материалов: E2T расширяет возможности искусственного интеллекта
Изображение носит иллюстративный характер

В современной материаловедческой науке одной из главных задач остаётся открытие совершенно новых материалов в областях, где данных пока нет. Однако машинное обучение традиционно эффективно лишь при интерполяции — предсказаниях в пределах известных данных. Сбор данных о материалах крайне затратен, что ограничивает возможности традиционных алгоритмов и препятствует поиску новых решений за пределами изученных пространств.

E2T решает эту проблему благодаря особой архитектуре. Основу алгоритма составляет нейронная сеть с механизмом внимания, которая обучается на множестве искусственно созданных экстраполятивных задач, так называемых «эпизодов». Каждый эпизод формируется из тренировочного набора и одной пары «материал — его свойство», не встречавшейся в исходных данных. Мета-обучение позволяет модели самостоятельно вырабатывать стратегии экстраполяции.

Алгоритм E2T был протестирован на более чем сорока задачах по прогнозированию свойств полимерных и неорганических материалов. В подавляющем большинстве случаев E2T превосходил стандартные методы машинного обучения именно по точности экстраполятивных прогнозов. Для данных, близких к исходным, точность E2T была не ниже, а порой выше, чем у традиционных моделей. Хотя абсолютной точности, сравнимой с «оракулом» — моделью, обученной на всех возможных данных, включая экстраполятивные области — E2T не достиг, его алгоритм имеет важное преимущество: быстрое обучение на новых задачах с минимальным набором данных позволяет быстро приблизиться к результатам «оракула».

В последние годы бурное развитие технологий машинного обучения ускорило открытие новых материалов. Ключевой составляющей этого прогресса стали технологии предсказания свойств, позволяющие виртуально оценивать миллионы и миллиарды кандидатов. Тем не менее, все современные ИИ-алгоритмы, включая самые сложные генеративные языковые модели, по сути своей остаются интерполятивными и не позволяют уверенно выходить в неизведанные пространства материалов.

Среди известных подходов к экстраполяции выделяют генерализацию по доменам, увеличение разнообразия данных, интеграцию физических знаний (например, физически информированные нейронные сети) и мета-обучение. E2T представляет собой новый тип мета-обучающегося алгоритма, ориентированного на прямое экстраполятивное обучение.

В человеческом обучении способность быстро приспосабливаться связывают с врождёнными особенностями и богатым опытом. В алгоритме E2T аналогичный эффект достигается за счёт систематического погружения в разнообразные задачи, что позволяет искусственному интеллекту имитировать человеческую гибкость.

Главный вызов для материаловедения — возможность исследовать абсолютно неизвестные области, создавая материалы из новых элементов или принципиально иных протоколов синтеза. Открытым остаётся вопрос: смогут ли модели, обученные на ограниченных данных, действительно экстраполировать в совершенно новые условия? E2T даёт простой и эффективный ответ на этот вызов, хотя пока доказательства его универсальности ограничены отдельными случаями.

Если в будущем будет доказана универсальность E2T, это приведёт к революционным изменениям не только в науке о материалах, но и в других научных областях, где важна экстраполяция. Особенно перспективным выглядит применение E2T для так называемых foundation models — крупных универсальных моделей, которые можно быстро дообучать для решения конкретных задач с минимальными затратами данных. Потенциал E2T заключается в значительном улучшении экстраполятивных способностей и адаптивности моделей, что ускорит внедрение инноваций в искусственный интеллект для науки.


Новое на сайте

19521Банковский троян VENON на Rust атакует Бразилию с помощью девяти техник обхода защиты 19520Бонобо агрессивны не меньше шимпанзе, но всё решают самки 19519Почему 600-килограммовый зонд NASA падает на Землю из-за солнечной активности? 19518«Липовый календарь»: как расписание превращает работников в расходный материал 19517Вредоносные Rust-пакеты и ИИ-бот крадут секреты разработчиков через CI/CD-пайплайны 19516Как хакеры за 72 часа превратили npm-пакет в ключ от целого облака AWS 19515Как WebDAV-диск и поддельная капча помогают обойти антивирус? 19514Могут ли простые числа скрываться внутри чёрных дыр? 19513Метеорит пробил крышу дома в Германии — откуда взялся огненный шар над Европой? 19512Уязвимости LeakyLooker в Google Looker Studio открывали доступ к чужим базам данных 19511Почему тысячи серверов оказываются открытой дверью для хакеров, хотя могли бы ею не быть? 19510Как исследователи за четыре минуты заставили ИИ-браузер Perplexity Comet попасться на... 19509Может ли женщина без влагалища и шейки матки зачать ребёнка естественным путём? 19508Зачем учёные из Вены создали QR-код, который невозможно увидеть без электронного... 19507Девять уязвимостей CrackArmor позволяют получить root-доступ через модуль безопасности...
Ссылка