一: 首先准备两个文件:
1. 基因表达的counts.matrix 文件(即上一步生成的isoforms.counts.matrix 与genes.counts.matrix )
2. 生物学重复的表文件
记住samples.txt中的名字需要和matrix中的名字一致,否则没办法识别。
二: 调用PtR脚本
$PtR #调用PtR脚本
--matrix isoforms.counts.matrix #指定给定的matrix
--samples samples.txt #样品重复信息
--log2 #做一个对数处理
--min_rowSums 10 #过滤数据指标
--compare_replicates #输出的图像参数
同理做genes.counts.matrix,最终会生成许多pdf文件。
最后结果就是关于一个处理中生物学重复之间的相关性的几个图,放在一个PDF上的.
几个图的意思还没大懂,请指教!
三:下面进行跨样本间的相关性检测与作图
$PtR
--matrix isoforms.counts.matrix \
--min_rowSums 10 \
--samples samples.txt \
--log2 \ #数据转换参数
--CPM \ #数据转换参数
--sample_cor_matrix #输出样品相关性矩阵图
这个代码做出来的结果是不同样本间的数据一致性热图
四:最后一个结果是通过PCA分析对样品重复关系进行检测。
$PtR
--matrix isoform.counts.matrix \
--samples samples.txt \
--log2 \
--min_rowSums 10 \
--CPM \
--center_rows \
--prin_comp 3
输出结果为PCA分析图 (pdf)
同理做genes.counts.matrix。
到此结束!
欢迎交流,909474045@qq.com