Новое исследование, опубликованное 26 февраля в журнале Intelligent Computing, демонстрирует революционный подход к классификации звезд с использованием искусственного интеллекта. Работа под названием "Deep Learning and Methods Based on Large Language Models Applied to Stellar Light Curve Classification" представляет серию инновационных моделей StarWhisper LightCurve, которые значительно упрощают и улучшают процесс анализа звездных данных.

Исследователи разработали три различные модели ИИ для классификации звезд. Первая основана на большой языковой модели (созданной на базе Gemini 7B) и специализируется на классификации кривых блеска как структурированного временного ряда в текстовом формате. Вторая представляет собой мультимодальную языковую модель (на основе DeepSeek-VL-7B-Chat), которая обрабатывает графические представления кривых блеска. Третья модель — это аудиоязыковая модель (построенная на Qwen-Audio), которая преобразует кривые блеска в звуковые волны для последующего анализа.
Для обучения этих моделей использовались данные из миссий NASA Kepler и K2, которые содержат информацию о пяти основных типах переменных звезд. Особое внимание было уделено включению редких типов переменных звезд в обучающую выборку, что позволило улучшить обобщающую способность моделей.
Результаты исследования впечатляют: гибридная модель глубокого обучения Conv1D + BiLSTM, сочетающая сверточные и рекуррентные слои, достигла точности 94%. Еще более впечатляющие результаты показала модель Swin Transformer с общей точностью 99%, хотя для редкого класса звезд — цефеид типа II, составляющих всего 0,02% набора данных, точность была ниже и составила 83%.
Комплексная система StarWhisper LightCurve продемонстрировала почти 90% точности при минимальном ручном вмешательстве, что делает ее особенно ценной для практического применения в астрономических исследованиях.
Технические преимущества предложенного подхода включают автоматизированную оптимизацию глубокого обучения (скорость обучения, размер пакета, сложность модели), что значительно снижает потребность в ручной настройке и явном конструировании признаков. Это позволяет проводить параллельный анализ данных и расширяет применение мультимодального ИИ в астрономии.
Новые модели искусственного интеллекта могут существенно ускорить обработку огромных объемов астрономических данных, которые генерируются современными телескопами. Это особенно важно в контексте будущих миссий, которые будут производить еще больше информации о переменных звездах и других космических объектах.
Исследование демонстрирует, как современные методы искусственного интеллекта могут быть адаптированы для решения специфических научных задач, открывая новые возможности для астрономических открытий и углубления нашего понимания Вселенной.

Изображение носит иллюстративный характер
Исследователи разработали три различные модели ИИ для классификации звезд. Первая основана на большой языковой модели (созданной на базе Gemini 7B) и специализируется на классификации кривых блеска как структурированного временного ряда в текстовом формате. Вторая представляет собой мультимодальную языковую модель (на основе DeepSeek-VL-7B-Chat), которая обрабатывает графические представления кривых блеска. Третья модель — это аудиоязыковая модель (построенная на Qwen-Audio), которая преобразует кривые блеска в звуковые волны для последующего анализа.
Для обучения этих моделей использовались данные из миссий NASA Kepler и K2, которые содержат информацию о пяти основных типах переменных звезд. Особое внимание было уделено включению редких типов переменных звезд в обучающую выборку, что позволило улучшить обобщающую способность моделей.
Результаты исследования впечатляют: гибридная модель глубокого обучения Conv1D + BiLSTM, сочетающая сверточные и рекуррентные слои, достигла точности 94%. Еще более впечатляющие результаты показала модель Swin Transformer с общей точностью 99%, хотя для редкого класса звезд — цефеид типа II, составляющих всего 0,02% набора данных, точность была ниже и составила 83%.
Комплексная система StarWhisper LightCurve продемонстрировала почти 90% точности при минимальном ручном вмешательстве, что делает ее особенно ценной для практического применения в астрономических исследованиях.
Технические преимущества предложенного подхода включают автоматизированную оптимизацию глубокого обучения (скорость обучения, размер пакета, сложность модели), что значительно снижает потребность в ручной настройке и явном конструировании признаков. Это позволяет проводить параллельный анализ данных и расширяет применение мультимодального ИИ в астрономии.
Новые модели искусственного интеллекта могут существенно ускорить обработку огромных объемов астрономических данных, которые генерируются современными телескопами. Это особенно важно в контексте будущих миссий, которые будут производить еще больше информации о переменных звездах и других космических объектах.
Исследование демонстрирует, как современные методы искусственного интеллекта могут быть адаптированы для решения специфических научных задач, открывая новые возможности для астрономических открытий и углубления нашего понимания Вселенной.