Сможет ли AI раскрыть тайны скрытых белков?

Применение генеративного искусственного интеллекта в биологии открывает новые возможности для декодирования белков – ключевых агентов клеточных процессов. Инструменты InstaNovo (IN) и InstaNovo+ (IN+), представленные 31 марта в журнале Nature Machine Intelligence, позволяют идентифицировать белковые последовательности, ранее ускользавшие от традиционных методов обнаружения.
Сможет ли AI раскрыть тайны скрытых белков?
Изображение носит иллюстративный характер

Белки, выступающие «рабочими лошадками» клеток, реализуют функции, заложенные в ДНК, но могут подвергаться модификациям и расщеплениям после синтеза, что приводит к появлению скрытых сегментов. Такие отклонения оказываются критичными для понимания механизмов рака, заболеваний и уникальных адаптаций, как, например, в почках скатов, позволяющих этим животным адаптироваться к переменам солёности воды.

InstaNovo использует архитектуру, схожую с GPT-4 от OpenAI, переводя спектральный «отпечаток» белков, полученный методом масс-спектрометрии, в последовательность аминокислот. В свою очередь, InstaNovo+ применяет диффузионную модель, устраняя шум и формируя ясное изображение молекулярной структуры, что позволяет реконструировать даже ранее неизвестные белковые сегменты.

Сравнение с традиционными методами, такими как поиск по базам данных и трансформерный декодер Casanovo, демонстрирует, что новые инструменты проявляют наилучшую эффективность в сложных задачах секвенирования. При тестировании на человеческих иммунных белках модель IN обнаружила примерно в три раза больше кандидатов, увеличив число выявленных пептидов с 10 000 до более чем 35 000, а IN+ – в шесть раз, что подтверждает преимущество их комбинированного применения.

Химик и специалист по белкам из Национального института стандартов и технологий в Гейтерсбурге, Мэриленд, Бенджамин Нили отмечает: «Эти инструменты приближают нас к,святому Граалю' массовой идентификации неизвестных белков». Химик по анализу белков из Dana-Farber Cancer Institute в Бостоне, Аманда Смейзерс, подчеркивает, что ИИ-секвенирование не заменяет поиск по базам данных, а служит важным дополнением для исследования причин, по которым некоторые виды рака вызывают резкое истощение мышечной массы.

Коавтор и специалист по вычислительной биоинженерии из Технического университета Дании в Лынгби, Константинос Калогеропулос, предупреждает о вероятном уровне ложноположительных результатов, оцениваемом примерно в 5%, что требует дополнительной проверки полученных данных. Разработчик Casanovo и исследователь протеомики из Университета Вашингтона в Сиэтле, Уильям Нобл, продолжает изучать оптимальные способы оценки эффективности новых ИИ-инструментов.

Новейшие модели вписываются в цепочку революционных достижений искусственного интеллекта в биологии, наряду с AlphaFold, изменившим подход к предсказанию сворачивания белков, и дизайном белков, удостоенным Нобелевской премии в 2024 году. Способность обнаруживать ранее неучтённые белковые сегменты обещает стать следующим крупным скачком в фундаментальных исследованиях, диагностике и разработке новых методов лечения.

Обучение моделей проводилось с использованием расширяющейся базы данных Proteome Tools, что позволяет предсказывать белковые сегменты, отсутствующие в традиционных каталогах. Комбинированное применение InstaNovo и InstaNovo+ значительно расширяет возможности секвенирования, открывая новые перспективы в изучении механизмов клеточной работы и адаптивных процессов в живых организмах.


Новое на сайте

19521Банковский троян VENON на Rust атакует Бразилию с помощью девяти техник обхода защиты 19520Бонобо агрессивны не меньше шимпанзе, но всё решают самки 19519Почему 600-килограммовый зонд NASA падает на Землю из-за солнечной активности? 19518«Липовый календарь»: как расписание превращает работников в расходный материал 19517Вредоносные Rust-пакеты и ИИ-бот крадут секреты разработчиков через CI/CD-пайплайны 19516Как хакеры за 72 часа превратили npm-пакет в ключ от целого облака AWS 19515Как WebDAV-диск и поддельная капча помогают обойти антивирус? 19514Могут ли простые числа скрываться внутри чёрных дыр? 19513Метеорит пробил крышу дома в Германии — откуда взялся огненный шар над Европой? 19512Уязвимости LeakyLooker в Google Looker Studio открывали доступ к чужим базам данных 19511Почему тысячи серверов оказываются открытой дверью для хакеров, хотя могли бы ею не быть? 19510Как исследователи за четыре минуты заставили ИИ-браузер Perplexity Comet попасться на... 19509Может ли женщина без влагалища и шейки матки зачать ребёнка естественным путём? 19508Зачем учёные из Вены создали QR-код, который невозможно увидеть без электронного... 19507Девять уязвимостей CrackArmor позволяют получить root-доступ через модуль безопасности...
Ссылка