Разработана новая технология на основе больших языковых моделей (LLM), способная не только предсказывать возможность синтеза новых материалов, но и объяснять причины таких прогнозов. Эта работа выполнена исследовательской группой под руководством профессора Юсунга Чжуна из Сеульского национального университета в сотрудничестве с Фордемским университетом (США).

Точное предсказание синтезируемости материалов является критически важной, но сложной задачей при разработке новых соединений. Проектирование материалов без учета возможности их реального получения приводит к неэффективному использованию исследовательских ресурсов и времени, поскольку эксперименты проводятся над непроверенными гипотетическими структурами.
Существующие методы оценки сталкиваются с ограничениями. Оценка термодинамической стабильности часто дает невысокую точность и показывает значительные расхождения с реальным успехом экспериментов. Ранее разработанные модели машинного обучения в основном фокусировались на классификации и не обладали достаточной объяснимостью, не раскрывая причин своих прогнозов.
Команда профессора Чжуна, где первым автором выступил постдокторант Сонмин Ким, обнаружила, что LLM могут точно предсказывать синтезируемость и предоставлять объяснения. Исследователи доработали (fine-tuned) универсальную LLM, используя наборы данных о неорганических кристаллических материалах, отформатированные как текст.
Целью обучения модели было классифицировать синтезируемость конкретных гипотетических материалов, предсказывать необходимые соединения-прекурсоры для синтеза, а также выявлять и интерпретировать ключевые факторы, влияющие на возможность синтеза. Основное внимание уделялось неорганическим кристаллическим полиморфам.
Разработанная LLM достигла более высокого уровня точности прогнозирования по сравнению с существующими специализированными моделями машинного обучения. Ключевым преимуществом стала способность LLM предоставлять интерпретируемые объяснения того, почему материал является (или не является) синтезируемым, что позволяет анализировать причины трудностей синтеза гипотетических структур и выявлять препятствующие факторы.
Профессор Юсунг Чжун отметил: «Это исследование важно, поскольку оно демонстрирует, что LLM могут не только точно предсказывать синтезируемость новых материалов, но и интерпретировать обоснование этих прогнозов и выявлять лежащие в их основе химические принципы». В ходе работы были успешно обнаружены ранее неизвестные сложные корреляции и факторы, влияющие на осуществимость синтеза материалов.
Результаты исследования были опубликованы в двух ведущих научных журналах. Статья Сонмина Кима как первого автора вышла в Journal of the American Chemical Society (JACS) 11 июля 2024 года, а другая работа – в Angewandte Chemie International Edition 13 февраля 2025 года.
Ожидается, что данная технология окажет значительное влияние на процесс проектирования материалов и смежные отрасли. Она позволяет на ранних этапах отсеивать кандидатов с низкой вероятностью синтеза и помогает оптимизировать трудносинтезируемые материалы, превращая их в более доступные формы. Это ускоряет разработку материалов и сокращает время по сравнению с традиционными экспериментами методом проб и ошибок.
Технология способна внести существенный вклад в развитие передовых материалов, повысить конкурентоспособность полупроводниковой промышленности и индустрии вторичных аккумуляторов. Ожидается, что она поможет Корее сохранить технологическое лидерство в области передовых материалов и обеспечит преимущество на ранних этапах выхода на рынок.
Потенциально разработка может стать критически важным инструментом для исследовательских институтов и компаний, позволяя быстро идентифицировать новые материалы и оценивать их пригодность для массового производства. Основные области применения включают проектирование полупроводниковых устройств и высокоэффективных материалов для аккумуляторов.
«По мере дальнейшего развития технологий на основе LLM ожидается, что они будут предлагать более эффективные и интуитивно понятные направления для проектирования новых материалов», — добавил профессор Юсунг Чжун, говоря о перспективах.

Изображение носит иллюстративный характер
Точное предсказание синтезируемости материалов является критически важной, но сложной задачей при разработке новых соединений. Проектирование материалов без учета возможности их реального получения приводит к неэффективному использованию исследовательских ресурсов и времени, поскольку эксперименты проводятся над непроверенными гипотетическими структурами.
Существующие методы оценки сталкиваются с ограничениями. Оценка термодинамической стабильности часто дает невысокую точность и показывает значительные расхождения с реальным успехом экспериментов. Ранее разработанные модели машинного обучения в основном фокусировались на классификации и не обладали достаточной объяснимостью, не раскрывая причин своих прогнозов.
Команда профессора Чжуна, где первым автором выступил постдокторант Сонмин Ким, обнаружила, что LLM могут точно предсказывать синтезируемость и предоставлять объяснения. Исследователи доработали (fine-tuned) универсальную LLM, используя наборы данных о неорганических кристаллических материалах, отформатированные как текст.
Целью обучения модели было классифицировать синтезируемость конкретных гипотетических материалов, предсказывать необходимые соединения-прекурсоры для синтеза, а также выявлять и интерпретировать ключевые факторы, влияющие на возможность синтеза. Основное внимание уделялось неорганическим кристаллическим полиморфам.
Разработанная LLM достигла более высокого уровня точности прогнозирования по сравнению с существующими специализированными моделями машинного обучения. Ключевым преимуществом стала способность LLM предоставлять интерпретируемые объяснения того, почему материал является (или не является) синтезируемым, что позволяет анализировать причины трудностей синтеза гипотетических структур и выявлять препятствующие факторы.
Профессор Юсунг Чжун отметил: «Это исследование важно, поскольку оно демонстрирует, что LLM могут не только точно предсказывать синтезируемость новых материалов, но и интерпретировать обоснование этих прогнозов и выявлять лежащие в их основе химические принципы». В ходе работы были успешно обнаружены ранее неизвестные сложные корреляции и факторы, влияющие на осуществимость синтеза материалов.
Результаты исследования были опубликованы в двух ведущих научных журналах. Статья Сонмина Кима как первого автора вышла в Journal of the American Chemical Society (JACS) 11 июля 2024 года, а другая работа – в Angewandte Chemie International Edition 13 февраля 2025 года.
Ожидается, что данная технология окажет значительное влияние на процесс проектирования материалов и смежные отрасли. Она позволяет на ранних этапах отсеивать кандидатов с низкой вероятностью синтеза и помогает оптимизировать трудносинтезируемые материалы, превращая их в более доступные формы. Это ускоряет разработку материалов и сокращает время по сравнению с традиционными экспериментами методом проб и ошибок.
Технология способна внести существенный вклад в развитие передовых материалов, повысить конкурентоспособность полупроводниковой промышленности и индустрии вторичных аккумуляторов. Ожидается, что она поможет Корее сохранить технологическое лидерство в области передовых материалов и обеспечит преимущество на ранних этапах выхода на рынок.
Потенциально разработка может стать критически важным инструментом для исследовательских институтов и компаний, позволяя быстро идентифицировать новые материалы и оценивать их пригодность для массового производства. Основные области применения включают проектирование полупроводниковых устройств и высокоэффективных материалов для аккумуляторов.
«По мере дальнейшего развития технологий на основе LLM ожидается, что они будут предлагать более эффективные и интуитивно понятные направления для проектирования новых материалов», — добавил профессор Юсунг Чжун, говоря о перспективах.