转录组原理、分析步骤介绍

如题所述

第1个回答  2022-07-20

基因课FTP地址: ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

-1 比对 把各个样本的fastq格式的reads比对到基因组序列上, 得到一个bam格式的文件(sample.bam)

-2 定量 数每个基因上落了几条reads,需要将基因结构画在染色体上 → 基因表达量(表格),又称 原始的reads count 矩阵
以上为 转录组标准分析
(非模式物种的可变剪接、融合基因分析不值当)

-3 原始reads count矩阵标准化(细节见转录组原理篇课程)
RPKM(PE)/FPKM(SE) (该方法是错的,但得出的结论基本上是对的)
TPM (对的)
(重复序列处理方式:可以匹配到多个位置。uniq, EM算法,自动用贝叶斯算一个概率)