差异表达分析95120
组的含义是样本在不同时期基因表达的差异
1.输入
-生成的config.matrix,表示为reads counts 矩阵。
-样本信息表(sample.info.txt)
vi filename
在文档中建立分组与样品一一对应的文件。
-比较信息表
vi contrast.txt
组1 组2
组2 组3
......
软件&命令
-DESeq2/edgeR
-trinity软件包里有run_DE_analysis.pl程序可以直接分析
可以使用conda 安装该软件
运行:
-查看新生成的目录下的result文件即可
差异表达的原理
-1.假设检验的方法计算
p值,一般小于0.05认为有差异
生物学重复越多,鉴定到的差异表达基因也就越多
筛选条件:
Padj<0.05且Fold Change>2
筛选出的结果进行可视化
火山图和热图
无生物学重复的情况
上方的运行程序修改,且仅能用edgeR的软件进行,再设置组内分歧度。