Национальный синхротронный источник света II (NSLS-II) в Брукхейвен, Национальная лаборатория Брукхейвена, функционирующий под эгидой Министерства энергетики США и его офиса науки, является одним из наиболее передовых центров, где технологии искусственного интеллекта и машинного обучения трансформируют весь научный процесс.

В условиях роста автоматизации, робототехники и применения ИИ традиционные методы обработки данных быстро перестают справляться с огромными объёмами информации. Усиление лучей и ускоренные эксперименты генерируют высококачественные, но чрезвычайно объёмные данные, требующие мгновенного анализа для оптимизации подготовки образцов, корректировки экспериментов и обнаружения ошибок в реальном времени.
Применение методов обнаружения аномалий позволяет осуществлять непрерывный контроль качества в режиме 24/7, когда эксперименты могут идти даже в отсутствие операторов. Контролируемые модели машинного обучения, обученные на сотнях и тысячах примеров корректных и некорректных измерений, интегрируются с внутренними платформами оповещений, обеспечивая оперативное сообщение о сбоях, повреждениях образцов или технических неполадках и тем самым экономят драгоценное время работы луча.
Цифровые ассистенты для пользователей, основанные на больших языковых моделях с механизмом retrieval augmented generation, отвечают на общие вопросы и предоставляют специализированную информацию по работе на NSLS-II. Такие чат-боты облегчают навигацию в системе подачи заявок, ориентацию в процессе проектирования эксперимента, а также помогают персоналу, суммируя и категоризируя объем данных заявок для выявления самых распространенных потребностей пользователей.
Применение приемов анализа данных, таких как неконтролируемое обучение, неотрицательная матричная факторизация и иерархическая кластеризация, позволяет в реальном времени структурировать, визуализировать и сортировать сложнейшие экспериментальные данные. Например, при исследовании расплавленной соли метод неотрицательной матричной факторизации выявил промежуточную фазу при нагреве, демонстрируя способность подхода обнаруживать истинные физические закономерности.
Инновационные алгоритмы ИИ, такие как X-ray Crystallography Companion Agent (XCA), разработанный командой NSLS-II для высокопроизводительного анализа рентгенодиффракционных данных, применяют полностью синтетический обучающий набор и вероятностные модели для идентификации известных фаз в экспериментальных данных в реальном времени. Кроме того, использование вычислений роя и алгоритмов обучения с подкреплением для оптимизации распределения лучевого времени и управления автономными экспериментами позволяет проводить измерения на нескольких удалённых линиях одновременно – достижение, признанное мировым первенством в области лучевой науки.
Развитие интерфейсов человек–ИИ способствует созданию интегрированной среды, где исследователи активно взаимодействуют с огромными наборами данных. Автоматизированные агенты на базе ИИ выполняют задачи классификации данных, предлагают новые измерения, а «мета-агенты» помогают выбирать оптимальные инструменты для управления экспериментальными установками, что позволяет пользователям, не обладающим специализированными знаниями в ИИ, легко пользоваться передовыми технологиями.
Платформа Bluesky, являющаяся открытым программным комплексом для сбора, хранения, управления и анализа экспериментальных данных, стандартизирует интерфейсы по всему NSLS-II. Модульный и адаптивный набор инструментов Bluesky способствует быстрой интеграции различных ИИ-методов, упрощая обмен данными между экспериментальными линиями и лабораториями и стимулируя межфакторное сотрудничество в международном научном сообществе.
Комплексное применение технологий ИИ и машинного обучения позволяет ускорить проведение экспериментов, повысить их точность и значительно расширить возможности исследований. Совместное использование специализированных ИИ-агентов и экспертного участия исследователей открывает новые горизонты для решения самых сложных научных задач и продвижения в области материаловедения и лучевой науки.

Изображение носит иллюстративный характер
В условиях роста автоматизации, робототехники и применения ИИ традиционные методы обработки данных быстро перестают справляться с огромными объёмами информации. Усиление лучей и ускоренные эксперименты генерируют высококачественные, но чрезвычайно объёмные данные, требующие мгновенного анализа для оптимизации подготовки образцов, корректировки экспериментов и обнаружения ошибок в реальном времени.
Применение методов обнаружения аномалий позволяет осуществлять непрерывный контроль качества в режиме 24/7, когда эксперименты могут идти даже в отсутствие операторов. Контролируемые модели машинного обучения, обученные на сотнях и тысячах примеров корректных и некорректных измерений, интегрируются с внутренними платформами оповещений, обеспечивая оперативное сообщение о сбоях, повреждениях образцов или технических неполадках и тем самым экономят драгоценное время работы луча.
Цифровые ассистенты для пользователей, основанные на больших языковых моделях с механизмом retrieval augmented generation, отвечают на общие вопросы и предоставляют специализированную информацию по работе на NSLS-II. Такие чат-боты облегчают навигацию в системе подачи заявок, ориентацию в процессе проектирования эксперимента, а также помогают персоналу, суммируя и категоризируя объем данных заявок для выявления самых распространенных потребностей пользователей.
Применение приемов анализа данных, таких как неконтролируемое обучение, неотрицательная матричная факторизация и иерархическая кластеризация, позволяет в реальном времени структурировать, визуализировать и сортировать сложнейшие экспериментальные данные. Например, при исследовании расплавленной соли метод неотрицательной матричной факторизации выявил промежуточную фазу при нагреве, демонстрируя способность подхода обнаруживать истинные физические закономерности.
Инновационные алгоритмы ИИ, такие как X-ray Crystallography Companion Agent (XCA), разработанный командой NSLS-II для высокопроизводительного анализа рентгенодиффракционных данных, применяют полностью синтетический обучающий набор и вероятностные модели для идентификации известных фаз в экспериментальных данных в реальном времени. Кроме того, использование вычислений роя и алгоритмов обучения с подкреплением для оптимизации распределения лучевого времени и управления автономными экспериментами позволяет проводить измерения на нескольких удалённых линиях одновременно – достижение, признанное мировым первенством в области лучевой науки.
Развитие интерфейсов человек–ИИ способствует созданию интегрированной среды, где исследователи активно взаимодействуют с огромными наборами данных. Автоматизированные агенты на базе ИИ выполняют задачи классификации данных, предлагают новые измерения, а «мета-агенты» помогают выбирать оптимальные инструменты для управления экспериментальными установками, что позволяет пользователям, не обладающим специализированными знаниями в ИИ, легко пользоваться передовыми технологиями.
Платформа Bluesky, являющаяся открытым программным комплексом для сбора, хранения, управления и анализа экспериментальных данных, стандартизирует интерфейсы по всему NSLS-II. Модульный и адаптивный набор инструментов Bluesky способствует быстрой интеграции различных ИИ-методов, упрощая обмен данными между экспериментальными линиями и лабораториями и стимулируя межфакторное сотрудничество в международном научном сообществе.
Комплексное применение технологий ИИ и машинного обучения позволяет ускорить проведение экспериментов, повысить их точность и значительно расширить возможности исследований. Совместное использование специализированных ИИ-агентов и экспертного участия исследователей открывает новые горизонты для решения самых сложных научных задач и продвижения в области материаловедения и лучевой науки.