基迪奥在线课堂“基因表达量计算与差异表达分析”
“基因表达量计算和差异表达分析”,这两项分析是转录组数据分析的基础。在接下来的两次在线交流课程中,我们将会详细介绍这两项分析的原理和常见的计算方法。并且进一步讨论不同方法的优缺点和对后续数据分析的影响。
在第一章中,我们将会详细介绍转录组分析中基因(转录本)表达量计算的方法。转录组表达量计算简要说来分为三个步骤:
- 比对:将测序得到reads 比对到参考序列上;
- Read count计算:估算每一个基因(转录本)相应的reads 数量;
- Read count归一化:将每一个基因(转录本)的reads数量转化为基因的表达量值,便于样本间的比较。
(1)一条read是否可以代表一条转录本?同时衍生出三个定义:RPKM、FPKM以及TPM,那么三者间有什么区别?因为在不同的测序项目中,可能会涉及到三个不同的概念,因此可能会给大家带来一些混淆。
(2)二代测序的表达定量,本质和荧光定量PCR相同:需要参照一个标准来换算出每个基因的表达量。这个参考标准可能是样本的总数据量,可能是样本中基因表达量的中位数,也可能是内参基因。那么,不同处理策略间有什么优缺点?在特定项目中,选用错误的策略会对后续的结果产生什么影响?我们将使用一些实际案例来解释这些问题。
第一章是第二章的基础,在讨论完第一章的问题后,在第二章内容中我们将会进一步讨论:表达量差异分析都有哪些常见方法以及它们的优缺点是什么?