横向——覆盖度(coverage)
所谓覆盖度,也可以理解成“有多少基因组区域被覆盖”,一般是一个百分比。比如我们的bam文件在chr1的覆盖度为70%,就表示只有30%的chr1范围内,一条reads也没有。
纵向——测序深度(depth)
测序深度是统计落在基因组区域中的总碱基数量,然后除以这个区域的长度。结果一般是1X、5X、10X这样表示。
计算覆盖度,测序深度方法
自用
-
根据目标区域提取bam信息(https://blog.csdn.net/tanzuozhev/article/details/88975801)
用bedtools根据目标区域bed文件提取bam信息
bedtools intersect -a results.sort.bam -b target.bed > target.region.bam
如果我们认为数据定量得到的基因表达量偏低,想看看基因区域的覆盖度和覆盖深度情况,基于此,从基因 gff 文件中提取bed位置文件,我们可以选第三列为外显子的行($3=="exon"),不选第三列为基因的行,因为后者得到的bed文件往下算覆盖度和覆盖深度都低一些
-
bamdst计算覆盖度 coverage 和 depth
安装
cd /home/ytbao/bin
git clone https://github.com/shiquan/bamdst.git
cd bamdst/
make
./bamdst -h
echo 'PATH=$PATH:/home/ytbao/bin/bamdst/' >> ~/.bashrc
source ~/.bashrc
计算 coverage 和 depth
bamdst -p target.bed -o ./ target.region.bam
-o:output dir,似乎指定不了,结果只能生成在.bed,.bam所在的目录
结果解读见 https://www.jianshu.com/p/ac7b8e4d76e4
可关注coverage.report,chromosomes.report,其他文件作用也挺大
- bedtools genomecov 计算覆盖深度depth
用 bedtools genomecov 在基因组层面计算各个位点的覆盖深度,覆盖深度以单个碱基展示(-d参数),覆盖深度以bed区域的形式展示(-bg参数)
bedtools genomecov -ibam target.region.bam -bg
计算覆盖度,测序深度方法汇总:
bamdst;samtools depth;BAMStats;GATK DepthOfCoverage
https://www.jieandze1314.com/post/cnposts/239/ samtools depth计算测序深度
https://www.jianshu.com/p/d4bcb507e5c2#tocbar--8jtfod
参考:
刘小泽 https://www.jieandze1314.com/post/cnposts/239/
https://blog.csdn.net/tanzuozhev/article/details/88975801
TOP生物信息 https://www.jianshu.com/p/ac7b8e4d76e4