Транскриптомика изучает РНК клетки, предоставляя «снимок» ее текущей активности. Секвенирование РНК (RNA-seq) позволяет определить, какие гены активны и в каком количестве, что важно для понимания клеточных процессов. Bulk RNA-seq анализирует суммарную РНК из ткани, в то время как single-cell RNA-seq изучает экспрессию генов в отдельных клетках.
Исходные данные RNA-seq — это короткие фрагменты РНК (риды) в формате FASTQ. Первым шагом анализа является предобработка: удаление некачественных прочтений и адаптеров. Затем риды выравниваются на референсный геном, чтобы определить, каким генам они соответствуют, и подсчитываются. Это позволяет построить матрицу экспрессии, где столбцы – это образцы, строки – гены, а ячейки – количество молекул РНК данного гена в данном образце.
Анализ дифференциальной экспрессии определяет гены, чья активность меняется между разными образцами (например, контролем и экспериментом). Этот анализ часто проводится с использованием пакета DESeq2 в R, который использует статистические методы для определения значимых изменений. Результаты могут быть визуализированы с помощью MA-plot, тепловых карт или Volcano plot, которые подчеркивают дифференциально экспрессированные гены.
Дальнейший анализ включает обогащение по сигнальным и метаболическим путям. С помощью баз данных, таких как Reactome и KEGG, можно определить, какие клеточные процессы затронуты изменениями экспрессии генов. Это позволяет понять биологическое значение выявленных различий в экспрессии и может помочь в разработке терапевтических мишеней.
Изображение носит иллюстративный характер
Исходные данные RNA-seq — это короткие фрагменты РНК (риды) в формате FASTQ. Первым шагом анализа является предобработка: удаление некачественных прочтений и адаптеров. Затем риды выравниваются на референсный геном, чтобы определить, каким генам они соответствуют, и подсчитываются. Это позволяет построить матрицу экспрессии, где столбцы – это образцы, строки – гены, а ячейки – количество молекул РНК данного гена в данном образце.
Анализ дифференциальной экспрессии определяет гены, чья активность меняется между разными образцами (например, контролем и экспериментом). Этот анализ часто проводится с использованием пакета DESeq2 в R, который использует статистические методы для определения значимых изменений. Результаты могут быть визуализированы с помощью MA-plot, тепловых карт или Volcano plot, которые подчеркивают дифференциально экспрессированные гены.
Дальнейший анализ включает обогащение по сигнальным и метаболическим путям. С помощью баз данных, таких как Reactome и KEGG, можно определить, какие клеточные процессы затронуты изменениями экспрессии генов. Это позволяет понять биологическое значение выявленных различий в экспрессии и может помочь в разработке терапевтических мишеней.