deeptools系列01-multiBamSummary

一、deeptools multiBamSummary详细介绍

官网说明书——deeptools multiBamSummary

功能:计算两个以上(含两个)BAM文件的基因组区域的覆盖度。

两种模式:

        bin模式是对全基因组进行计算,针对大小相等的bins(默认值:10kb),这种模式用于评估BAM文件的全基因组相似性;

        BED-file模式是对指定区域进行计算。

标准输出文件:

        以.npz为后缀的文件,该文件不仅可以直接用于deeptools中的“plotCorrelation”计算并可视化覆盖度之间的相关性,而且也能用于deeptools中的“plotPCA”进行主成分分析。



二、deeptools multiBamSummary用法及参数

(1)bins mode

multiBamSummary bins --bamfiles file1.bam file2.bam -o results.npz

--bamfiles(-b):bam文件

--outFileName(-out / -o ):  输出文件名。

参数:

--labels(-l ) : 非默认的标签,用户自定义文件名标签。标签之间用空格隔开。

--smartLabels: 不用手动给输入的bam文件加标签,deeptools 会移除路径和扩展名后使用文件名。

--genomeChunkSize : 手动指定基因组大小。默认值为不指定,由bam文件的read 密度决定。

--binSize (-bs): 用于样品的基因组窗口大小。默认值是10kb。

--distanceBetweenBins (-n ): 默认情况下,multiBamSummary认为窗口是连续的。但是,为了节省计算时间,可以指定比窗口数更大的间隔长度,服务器会识别更少的bins.默认值是0。

--version: 显示程序版本号并退出。

--region(-r): 用于限制运行的基因组区域。当测试参数时,利用--region这个参数可以大大减少运行时间。格式是:chr:start:end。如 -region chr10 或者 -region chr10:456700:891000。

--blackListFileName(-bl):bed或gtf格式文件能够包括不用于分析的区域。通过排除基因组区块,能够产生重叠区域。对于Bam文件而言,如果一条read有部分黑名单区域或者片段间隔,那么这个read或者fragment也仍会被考虑在内。如果有相关情况,注意你应该调整有效的基因组大小。

--numberOfProcessor(-p): 使用处理器的数量。默认值是1。

--verbose(-v): 设置查看运行消息。

--outRawCounts:保存的couts数区域(制表符隔开)文件。

--scalingFactors:计算比例因子(DESeq2 方式)能用于bamCoverage并写入一个文件。该文件用制表符隔开样品列和比例因子列。

--extendReads(-e) : 该参数可以把reads扩展到fragment大小。

--ignoreDuplicates:具有相同起始终止位点的reads仅读一次。

--minMappingQuality:那些至少达到最低mapping质量得分的reads才能被考虑在内。

--centerReads:相对于片段长度,reads处于中心位置。

--samFlagInclude:基于sam flag包括在内的reads。默认值:None。

--samFlagExclude:基于sam flag之外的reads。默认值:None。

--minFragmentLength:最小的片段长度。默认值为0。

--maxFragmentLength:最大的片段长度。默认值为0。


(2)BED-file mode

multiBamSummary BED-file --BED selection.bed --bamfiles file1.bam file2.bam -o results.npz

参数:

--bamfiles(-b):bam文件,文件之间用空格隔开。

--outFileName(-out/-o): 输出文件名。

--BED:限制覆盖度分析的区域。

--labels(-l ) : 非默认的标签,用户自定义文件名标签。标签之间用空格隔开。

--smartLabels: 不用手动给输入的bam文件加标签,deeptools 会移除路径和扩展名后使用文件名。

--genomeChunkSize : 手动指定基因组大小。默认值为不指定,由bam文件的read 密度决定。

--version: 显示程序版本号并退出。

--region(-r): 用于限制运行的基因组区域。当测试参数时,利用--region这个参数可以大大减少运行时间。格式是:chr:start:end。如 -region chr10 或者 -region chr10:456700:891000。

--blackListFileName(-bl):bed或gtf格式文件能够包括不用于分析的区域。通过排除基因组区块,能够产生重叠区域。对于Bam文件而言,如果一条read有部分黑名单区域或者片段间隔,那么这个read或者fragment也仍会被考虑在内。如果有相关情况,注意你应该调整有效的基因组大小。

--numberOfProcessor(-p): 使用处理器的数量。默认值是1。

--verbose(-v): 设置查看运行消息。

--outRawCounts:保存的couts数区域(制表符隔开)文件。

--scalingFactors:计算比例因子(DESeq2 方式)能用于bamCoverage并写入一个文件。该文件用制表符隔开样品列和比例因子列。

--extendReads(-e) : 该参数可以把reads扩展到fragment大小。

--ignoreDuplicates:具有相同起始终止位点的reads仅读一次。

--minMappingQuality:那些至少达到最低mapping质量得分的reads才能被考虑在内。

--centerReads:相对于片段长度,reads处于中心位置。

--samFlagInclude:基于sam flag包括在内的reads。默认值:None。

--samFlagExclude:基于sam flag之外的reads。默认值:None。

--minFragmentLength:最小的片段长度。默认值为0。

--maxFragmentLength:最大的片段长度。默认值为0。

GTF/BED12 参数:

--metagene : 当BED12或GTF文件用于提供区域,会计算合并的外显子,而不是用5'端或3'端来定义间隔。默认值是False。

--transcriptID: 当GTF文件用于提供区域,第三列transcript用于计算。默认值是transcript。

--exonID: 当GTF文件用于提供区域,第三列exon用于计算。默认值是exon。

--transcript_id_designator: 默认值是transcript_id。


三、deeptools multiBamSummary实际操作

multiBamSummary bins --bamfiles x.bam y.bam --binSize=500 -p 20 --smartLabels -out readCounts.npz --outRawCounts readCounts.tab

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,636评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,890评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,680评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,766评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,665评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,045评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,515评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,182评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,334评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,274评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,319评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,002评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,599评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,675评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,917评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,309评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,885评论 2 341

推荐阅读更多精彩内容