Белки выполняют самые разные задачи в клетках и часто требуют точного расположения в одном из множества клеточных отделов, включая классические органеллы и мембранные компартменты без явных границ. Исследователи давно знали, что структура белка обеспечивает его функцию, но недооценивали важность того, куда именно белок направляется. До сих пор существовали только отдельные модели, способные по аминокислотной последовательности предсказывать локализацию, однако достижения, сопоставимые с AlphaFold, отсутствовали.
![Новая AI-система ведёт белки к нужной цели](/images/topic/9085.jpg)
Учёные из лаборатории Ричарда Янга в Институте Уайтхеда при Массачусетском технологическом институте (MIT) и сотрудники лаборатории Регины Барзилай в MIT CSAIL решили восполнить этот пробел, воспользовавшись совместным подходом биологов и специалистов по машинному обучению. В результате была создана модель под названием ProtGPS, опубликованная 6 февраля в журнале Science. Первые авторы работы — постдок Генри Килгор из группы Янга и аспиранты Итамар Чинн, Питер Микхаэль и Илан Митников из команды Барзилай.
ProtGPS обучена определять, к какому из 12 известных динамических клеточных компартментов попадёт белок по линейной аминокислотной последовательности. Модель также предсказывает, могут ли мутации, связанные с болезнями, сместить белок в неверное место. Исследователи рассмотрели более 200 000 белков с подтверждёнными мутациями, способными приводить к патологиям, и вычислили, какие изменения локализации могут объяснять механизм заболевания. В двадцати опытах с мечеными флуоресцентными белками модель точно предсказала, что мутантные версии белков больше не транспортируются в правильный отдел клетки.
Специалисты полагали, что одна из основных причин некоторых болезней может заключаться в нарушении адресации белков, и эти результаты показали, что подобные гипотезы верны. «Моя надежда в том, что это первый шаг на пути к мощной платформе, — отметил Ричард Янг. — Она поможет нам понять, как развиваются люди, как мутации нарушают естественные процессы и как выдвигать терапевтические гипотезы и разрабатывать лекарства». Эта точность в определении ошибок локализации открывает путь к проектированию и тестированию новых стратегий лечения.
Авторы также добавили к ProtGPS генеративный модуль, способный придумывать белки, похожие на естественные, но ориентированные на заданный компартмент. В одном из экспериментов модель сгенерировала десять белковых последовательностей, предназначенных для нуклеолы: четыре из них надёжно накопились именно там, а другие имели выраженную предрасположенность к этой области. «Мы действительно смогли перейти от компьютерного дизайна к экспериментам в лаборатории, — пояснила Регина Барзилай. — Мы протестировали и смогли узнать, насколько хорошо работает наш алгоритм».
По словам Илана Митникова, клетка настолько сложна, что подобные эксперименты помогают "нарушать" её работу точечно и наблюдать механизмы на молекулярном уровне. Питер Микхаэль подчеркнул, что их сотрудничество с биологами даёт редкую возможность сразу сопоставлять теоретические предсказания с реальными результатами. А Итамар Чинн добавил: «Мы получили полноценный функциональный дизайн белков с довольно высокой эффективностью по сравнению с другими генеративными моделями, и это очень воодушевляет».
Разработчики планируют расширять ProtGPS, чтобы охватывать больше типов клеточных структур и ещё глубже анализировать мутации, вызывающие болезни. Ожидается, что модель будет применяться подобно AlphaFold, помогая учёным точнее понимать функции белков и проектировать новые терапевтические молекулы. Среди возможных дальнейших шагов — создание лекарств, которые тоже будут адресно попадать в нужные компартменты, избегая нежелательных побочных эффектов. Эта междисциплинарная работа, объединившая специалистов по биологии, искусственному интеллекту и экспериментам по изучению клеток, даёт исследователям инструменты для более тонкого анализа патогенеза и разработки инновационных методов лечения.
![Новая AI-система ведёт белки к нужной цели](/images/topic/9085.jpg)
Изображение носит иллюстративный характер
Учёные из лаборатории Ричарда Янга в Институте Уайтхеда при Массачусетском технологическом институте (MIT) и сотрудники лаборатории Регины Барзилай в MIT CSAIL решили восполнить этот пробел, воспользовавшись совместным подходом биологов и специалистов по машинному обучению. В результате была создана модель под названием ProtGPS, опубликованная 6 февраля в журнале Science. Первые авторы работы — постдок Генри Килгор из группы Янга и аспиранты Итамар Чинн, Питер Микхаэль и Илан Митников из команды Барзилай.
ProtGPS обучена определять, к какому из 12 известных динамических клеточных компартментов попадёт белок по линейной аминокислотной последовательности. Модель также предсказывает, могут ли мутации, связанные с болезнями, сместить белок в неверное место. Исследователи рассмотрели более 200 000 белков с подтверждёнными мутациями, способными приводить к патологиям, и вычислили, какие изменения локализации могут объяснять механизм заболевания. В двадцати опытах с мечеными флуоресцентными белками модель точно предсказала, что мутантные версии белков больше не транспортируются в правильный отдел клетки.
Специалисты полагали, что одна из основных причин некоторых болезней может заключаться в нарушении адресации белков, и эти результаты показали, что подобные гипотезы верны. «Моя надежда в том, что это первый шаг на пути к мощной платформе, — отметил Ричард Янг. — Она поможет нам понять, как развиваются люди, как мутации нарушают естественные процессы и как выдвигать терапевтические гипотезы и разрабатывать лекарства». Эта точность в определении ошибок локализации открывает путь к проектированию и тестированию новых стратегий лечения.
Авторы также добавили к ProtGPS генеративный модуль, способный придумывать белки, похожие на естественные, но ориентированные на заданный компартмент. В одном из экспериментов модель сгенерировала десять белковых последовательностей, предназначенных для нуклеолы: четыре из них надёжно накопились именно там, а другие имели выраженную предрасположенность к этой области. «Мы действительно смогли перейти от компьютерного дизайна к экспериментам в лаборатории, — пояснила Регина Барзилай. — Мы протестировали и смогли узнать, насколько хорошо работает наш алгоритм».
По словам Илана Митникова, клетка настолько сложна, что подобные эксперименты помогают "нарушать" её работу точечно и наблюдать механизмы на молекулярном уровне. Питер Микхаэль подчеркнул, что их сотрудничество с биологами даёт редкую возможность сразу сопоставлять теоретические предсказания с реальными результатами. А Итамар Чинн добавил: «Мы получили полноценный функциональный дизайн белков с довольно высокой эффективностью по сравнению с другими генеративными моделями, и это очень воодушевляет».
Разработчики планируют расширять ProtGPS, чтобы охватывать больше типов клеточных структур и ещё глубже анализировать мутации, вызывающие болезни. Ожидается, что модель будет применяться подобно AlphaFold, помогая учёным точнее понимать функции белков и проектировать новые терапевтические молекулы. Среди возможных дальнейших шагов — создание лекарств, которые тоже будут адресно попадать в нужные компартменты, избегая нежелательных побочных эффектов. Эта междисциплинарная работа, объединившая специалистов по биологии, искусственному интеллекту и экспериментам по изучению клеток, даёт исследователям инструменты для более тонкого анализа патогенеза и разработки инновационных методов лечения.