Команда химиков из Массачусетского технологического института (MIT) совершила прорыв в области геномных исследований, разработав новаторский метод, который использует генеративный искусственный интеллект для быстрой и точной визуализации трехмерных структур генома внутри отдельных клеток. Этот подход значительно ускорит изучение экспрессии генов и ее регуляции, открывая новые горизонты в биологии и медицине.
Структура генома, известная как хроматин – комплекс ДНК и белков, в частности гистонов, играет фундаментальную роль в определении того, какие гены будут активны в клетке. Различные конфигурации хроматина влияют на доступность генов, что приводит к различиям в генной экспрессии между разными типами клеток. Понимание этих 3D-структур является ключом к расшифровке механизма клеточной дифференциации и множества болезней.
Существующие экспериментальные методы, такие как Hi-C и Dip-C, позволяющие определять трехмерные структуры хроматина, являются трудоемкими и отнимают много времени. К примеру, получение данных для одной клетки может занять целую неделю. Именно поэтому был разработан новый метод, основанный на генеративном искусственном интеллекте, способный прогнозировать эти 3D структуры непосредственно из последовательностей ДНК.
Разработанная учеными MIT модель искусственного интеллекта получила название ChromoGen. Эта двухкомпонентная система сочетает в себе возможности глубинного обучения для распознавания паттернов в последовательностях ДНК и генеративный ИИ для предсказания структур хроматина. Модель была обучена на основе 11 миллионов конформаций хроматина, полученных из 16 клеток линии человеческих B-лимфоцитов.
CromoGen способен анализировать единичные клетки, улавливая все разнообразие структур, возможных для конкретной области ДНК. Важно отметить, что модель способна давать точные прогнозы и для тех типов клеток, на которых она не обучалась. Генерируя тысячи структур за считанные минуты, ChronoGen значительно превосходит экспериментальные методы по скорости и эффективности. На создание 1000 структур с помощью модели уходит всего 20 минут.
Длинные цепи ДНК – около двух метров – должны уместиться в ядре клетки, диаметр которого составляет всего около одной сотой миллиметра. Для достижения этой цели ДНК плотно упаковывается, образуя хроматин. Эпигенетические модификации – химические «метки» на ДНК – также влияют на сворачивание хроматина. Исследования структуры хроматина велись учеными на протяжении последних 20 лет.
Потенциал применения модели ChromoGen огромен. Ученые смогут изучать, как мутации влияют на структуру хроматина, анализировать структурные различия между типами клеток и их влияние на экспрессию генов, выявлять причины различных болезней, включая рак, и разрабатывать новые методы лечения. Модель может анализировать тысячи пар оснований, а для тестирования модели после обучения использовалось более 2000 последовательностей ДНК.
Исследование опубликовано в журнале Science Advances. Старшим автором работы является Бин Чжан, доцент кафедры химии MIT, а ведущими авторами являются аспиранты MIT Грег Шуетте и Чжуохан Лао. Важно, что и данные, и сама модель находятся в открытом доступе, что способствует дальнейшему развитию исследований в области геномики.
Благодаря этой разработке, перед учеными открываются невиданные ранее возможности для изучения генома. С помощью ChromoGen можно в короткий срок проводить точный анализ и изучать структуру хроматина в разных клетках, проливая свет на процессы генной экспрессии. Это является большим шагом вперед на пути к более глубокому пониманию биологических механизмов и разработке новых методов лечения.
Структура генома, известная как хроматин – комплекс ДНК и белков, в частности гистонов, играет фундаментальную роль в определении того, какие гены будут активны в клетке. Различные конфигурации хроматина влияют на доступность генов, что приводит к различиям в генной экспрессии между разными типами клеток. Понимание этих 3D-структур является ключом к расшифровке механизма клеточной дифференциации и множества болезней.
Существующие экспериментальные методы, такие как Hi-C и Dip-C, позволяющие определять трехмерные структуры хроматина, являются трудоемкими и отнимают много времени. К примеру, получение данных для одной клетки может занять целую неделю. Именно поэтому был разработан новый метод, основанный на генеративном искусственном интеллекте, способный прогнозировать эти 3D структуры непосредственно из последовательностей ДНК.
Разработанная учеными MIT модель искусственного интеллекта получила название ChromoGen. Эта двухкомпонентная система сочетает в себе возможности глубинного обучения для распознавания паттернов в последовательностях ДНК и генеративный ИИ для предсказания структур хроматина. Модель была обучена на основе 11 миллионов конформаций хроматина, полученных из 16 клеток линии человеческих B-лимфоцитов.
CromoGen способен анализировать единичные клетки, улавливая все разнообразие структур, возможных для конкретной области ДНК. Важно отметить, что модель способна давать точные прогнозы и для тех типов клеток, на которых она не обучалась. Генерируя тысячи структур за считанные минуты, ChronoGen значительно превосходит экспериментальные методы по скорости и эффективности. На создание 1000 структур с помощью модели уходит всего 20 минут.
Длинные цепи ДНК – около двух метров – должны уместиться в ядре клетки, диаметр которого составляет всего около одной сотой миллиметра. Для достижения этой цели ДНК плотно упаковывается, образуя хроматин. Эпигенетические модификации – химические «метки» на ДНК – также влияют на сворачивание хроматина. Исследования структуры хроматина велись учеными на протяжении последних 20 лет.
Потенциал применения модели ChromoGen огромен. Ученые смогут изучать, как мутации влияют на структуру хроматина, анализировать структурные различия между типами клеток и их влияние на экспрессию генов, выявлять причины различных болезней, включая рак, и разрабатывать новые методы лечения. Модель может анализировать тысячи пар оснований, а для тестирования модели после обучения использовалось более 2000 последовательностей ДНК.
Исследование опубликовано в журнале Science Advances. Старшим автором работы является Бин Чжан, доцент кафедры химии MIT, а ведущими авторами являются аспиранты MIT Грег Шуетте и Чжуохан Лао. Важно, что и данные, и сама модель находятся в открытом доступе, что способствует дальнейшему развитию исследований в области геномики.
Благодаря этой разработке, перед учеными открываются невиданные ранее возможности для изучения генома. С помощью ChromoGen можно в короткий срок проводить точный анализ и изучать структуру хроматина в разных клетках, проливая свет на процессы генной экспрессии. Это является большим шагом вперед на пути к более глубокому пониманию биологических механизмов и разработке новых методов лечения.