DRUMMER

DRUMMER

DRUMMER旨在通过比较Nanopore直接RNA测序(DRS)数据集中的基序错误,识别不同转录本亚型的核苷酸级RNA修饰。

更新

DRUMMER v1.0现已发布,具有以下改进:

  • 一个单一的输出摘要文件,包含所有生物学重复的所有候选位点信息
  • 一个解析测试图,以确认所有读取都已包含
  • 改善了针对人类和病毒数据集的教程

注意:DRUMMER依赖的bam-readcount在OSX系统上据说不稳定,可能会导致DRUMMER失败。

目录

  • 引言
  • 安装
  • 先决条件
  • 设置
  • 运行DRUMMER
  • 输出
  • 使用测试数据集运行DRUMMER
  • 数据准备
  • 对齐和过滤
  • 为同种型模式设置转录本列表
  • 故障排除
  • 引用
  • 智慧

引言

实验设计定义了分析的背景和可能被识别的修饰。例如,比较来自亲本细胞系和METTL3-敲除细胞系的DRS数据集,可以检测到m6A。

安装

先决条件

DRUMMER需要以下软件包已安装并可在用户路径中使用:

  • SAMTools v1.3或更高版本
  • BEDTools v2.26或更高版本
  • BASH v4.2或更高版本
  • Python3及其模块:seaborn, scipy, pandas, numpy, biopython, matplotlib

使用git安装DRUMMER

git clone https://github.com/DepledgeLab/DRUMMER
cd DRUMMER
python DRUMMER.py -h

安装后,我们强烈建议使用包含的测试数据集之一测试DRUMMER - 见使用测试数据集运行DRUMMER。

设置Conda环境

# 安装环境
conda env create --file environment-setup.yml

# 激活DRUMMER环境
conda activate DRUMMER

# 运行DRUMMER
python DRUMMER.py -h

# 停用DRUMMER环境
conda deactivate

运行DRUMMER

DRUMMER需要两个坐标排序和索引的BAM文件作为输入。这些文件应包含测试(RNA修饰不存在)和对照(RNA修饰存在)数据集的读取对齐(见下面数据准备部分)。DRUMMER可以在外显子或同种型模式下运行。外显子模式(-a exome)使用DRS读取对准到给定生物体的基因组以识别可能被修饰的碱基,而同种型模式(-a isoform)使用DRS读取对准到给定生物体的转录组以提供高分辨率映射。虽然同种型模式更敏感,但目前也更慢。

使用方法:

python DRUMMER.py -r [FASTA] -l|-n [TARGETS] -c [CONTROL] -t [TREATMENT] -o [OUTPUT] -a [RUNMODE] (OPTIONS)

必需标志

  • -r FASTA格式的参考基因组(外显子)或转录组(同种型)
  • -l 要检查的转录本列表(同种型)(单列或七列格式)
    • 或 -
  • -n 基因组名称(外显子) - 必须与FASTA文件头匹配
  • -c 排序的.bam文件 - 对照(存在RNA修饰)
  • -t 排序的.bam文件 - 处理(不存在RNA修饰)
  • -o 输出目录
  • -a 运行模式(外显子|同种型)

可选标志

  • -z 赔率比截止值(默认= +/- 1.5)
  • -p padj截止值(默认= 0.05,用于OR和G-test)
  • -m 以m6A模式运行(默认=false)
  • -f 参考分数差异(默认= 0.01)
  • -v 为单个转录本生成可视化(默认=false)
  • -i 过滤插入或保留

输出

运行完成后,DRUMMER在每个比较目录中生成一个单独的制表符分隔文本文件(summary.txt),包含所有预测的候选RNA修饰位点及其上下文信息(基因组位置、同种型位置、序列基序等)。当以m6A模式(-a TRUE)运行时,还会在附带的.pdf文件(m6A_plot.pdf)中生成一个分布图。输出目录'complete_analysis'包含每个提供的参考序列的单独数据文件。第二个(可选[-v])目录'visualization'包含每个单独参考序列的G-test分数(积累/耗尽)与位置的单独图表,以及每个赔率比分数。

使用测试数据集运行DRUMMER

DRUMMER存储库中包含几个测试数据集,可用于验证DRUMMER在您的环境中是否正常工作。请注意,预期输出依赖于默认参数,更改这些参数可能会改变输出。

数据准备

对齐和过滤

DRUMMER需要包含每个比较的两个实验条件的转录组或基因组级别读取对齐的sorted.bam文件。注意,这是运行DRUMMER(或类似工具)时最关键的考虑因素。遵循您给出的是什么,您得到的就是什么的原则,您必须确信满足以下条件。

  • 每个读取都有一个单一的(主要的)对齐。所有次要/补充对齐都已被过滤掉
  • 每个读取都与正确的转录本序列对齐(仅限转录组分析)

为同种型模式设置转录本列表

当在同种型模式下运行DRUMMER时,应使用-u标志提供转录本ID列表。注意这些ID必须与转录组数据库中存在的头完全匹配。每个ID应单独一行提供(单列)例如:

E1A-s
E1A-l
E1A-9s

故障排除

  1. 复杂的FASTA头对DRUMMER来说是有问题的。因此,我们建议在生成对齐之前简化头。例如,人类转录组文件可能具有如下头:
>ENST00000641515.2|ENSG00000186092.6|OTTHUMG00000001094.4|OTTHUMT00000003223.4|OR4F5-202|OR4F5|2618|UTR5:1-60|CDS:61-1041|UTR3:1042-2618

最好简化为:

>ENST00000641515.2

这可以通过sed轻松实现:

sed 's/|.*$//g' infile > outfile
  1. 目前DRUMMER.py需要在所有情况下从DRUMMER目录内启动。这将在以后的版本中修复。

  2. 当使用多个重复运行DRUMMER时,如果fasta头中存在下划线和/或空格,则最终摘要表(跨所有重复)将无法生成。但是,每个重复目录中仍应生成summary.txt文件,指示修改状态。

  3. 在某些情况下,最终结果文件将包含少量缺失位置。这些是由于G-test和/或赔率比测试失败而被DRUMMER删除的。如果您希望恢复这些,则需要编辑motif.py(模块文件夹)并注释掉第40行,即#df = df.dropna()。请注意,这将略微调整调整后的p值的计算。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容