谈谈RNA-seq和GWAS中的 p value 和 Q value
二代测序数据是典型的大数据,统计是数据分析的基础。不同情况的P value估算是最常见的分析,例如:差异表达分析下的p value,gwas下的p value。由于检验次数的增加,多重检验校正又成为数据分析的必要步骤,于是Q value,adjusted p value,FDR等这些名词又冒了出来。有时候,大家都觉得晕啊!也许你可能遇到过这样的问题:
“Q value 为什么大于 p value呢”
“FDR 怎么大于1,是否分析出错了?”
“我的kegg 富集分析,FDR < 5%找不到关注的pathway,是否可以放宽阈值呢?”
“审稿人说,我的结果使用p value判断是不对的,必须使用多重检验校正后再判断是否显著”
... ...
如果你也遇过这些疑问,欢迎参加我们的在线讲堂。相信1个小时后,你将会豁然开朗。
本期在线交流的内容包括:
(1) 统计的基本概念
功能富集分析是什么逻辑?
当没有先验分布的时候,怎么估算置信区间(permutation、bootstrap等相关的方法)
(2)多重检验的目的
(3)多重检验的方法有哪些?
FDR、Q value、adjusted p value这些概念的由来和关系;
P vaLue 和 Q value的区别;
如何选取Q value的阈值标准;
如何从p value估算Q value;
欢迎大家加入QQ群与嘉宾交流切磋~ 交流QQ群 67185986