scDAPA:从单细胞转录组数据中检测可变聚腺苷酸化(APA)

多聚腺苷化(polyadenylation,poly(A))是转录本成熟过程中在3'末端发生的重要修饰步骤。选择性多聚腺苷化(Alternative Poly(A),APA)是真核生物中一种广泛存在的基础调控机制,不仅增加细胞中转录组和蛋白组的复杂性,并且影响目标RNA的功能、稳定性、定位和翻译效率。Poly(A)位点标识着转录本末尾,其准确识别是基因注释和转录调控机制研究的基础。APA表现出组织特异性,对细胞增殖和分化具有重要作用。

选择性聚腺苷酸(APA)在真核生物的mRNA稳定性和功能中起着关键的转录后调控作用。单细胞RNA-seq (scRNA-seq)是发现基因表达水平细胞异质性的有力工具。最常用的 10× scRNA-seq 3’丰富的建库策略, 使我们能够将APA的研究分辨率提高到单细胞水平。然而,目前还没有可用的计算工具来调查来自scRNA-seq数据的APA概况。

在这里,我们提出了一个软件包scDAPA检测和可视化动态APA从scRNA-seq数据。以bam/sam文件和细胞簇标签为输入,scDAPA使用基于直方图的方法和Wilcoxon秩和检验检测APA动态,并使用动态APA可视化候选基因。对标结果表明,scDAPA能从scRNA-seq数据中有效识别不同细胞群中具有动态APA的基因。 :https://scdapa.sourceforge.io.

一、APA类型:

(1)3’UTRAPA

大部分APA位点处于含有顺势作用元件(ciselements)的3’UTR区,3’UTR-APA会对转录后基因调控产生许多影响,如mRNA稳定性、mRNA核转移和定位以及编码蛋白定位。

图1. 3’UTR APA示意图[1]

(2)Upstream Region APA(UR-APA)

UR-APA位点位于最后一个外显子前,UR-APA引起末端外显子的可变表达,导致mRNA编码序列和3’UTR的变化。根据polyadenylation sites(PAS)的剪接模型,可将UR-APA分为两类:Skipped terminal exon和Composite terminal exon。Skipped terminal exon略过了末端外显子,而Composite terminal exon则由内部外显子延伸产生。

图2. UR-APA示意图[1]
unset PYTHONPATH 
source  software/miniconda3/bin/activate software/miniconda3/envs/velocyto

10X_RNA/Development/scDAPA/extractReads.sh -r  10X_RNA/Development/velocyto/example/CellRanger/pbmc5k/outs/possorted_genome_bam.bam -c 10X_RNA/Development/velocyto/example/CellRanger/pbmc5k/outs/analysis/clustering/kmeans_10_clusters/clusters.csv  -o ./result


10X_RNA/Development/scDAPA/extractGenes.sh -i10X_RNA/pipeline2.1/database/10X_Ref/refdata-cellranger-GRCh38-1.2.0/genes/genes.gtf  -o hg38.gene.gff 
export PATH=bedtools2/bin/:$PATH
10X_RNA/Development/scDAPA/annotate3Ends.sh  -d 10X_RNA/Development/scDAPA/example/result/  -g  10X_RNA/Development/scDAPA/example/hg38.gene.gff 

anno
Column Name Explanation
seqname The name of the sequence
source The program that generated this feature
feature The name of this type of feature
start The starting position of the feature in the sequence
end The ending position of the feature
score A score between 0 and 1000
strand Valid entries include "+", "-", or "."
frame If the feature is not a coding exon, the value should be "."
gene Gene ID and name
start of read The starting positions of reads annoted to this gene, separated by comma
end of read The ending positions of reads annoted to this gene, separated by comma

将上述结果导入R包scDAPAminer

> library(scDAPAminer)
> # creat a folder named 'stat'
> # 1. only compare two specific cell groups
> scDAPAdetect(file1='./result/1.anno',file2='./result/2.anno',type='f2f',output_dir='./stat')
> 
> # 2. compare every two cell groups stored in the ./result directory
> scDAPAdetect(dir='./result',type='d',output_dir='./stat',bin_size=100,count_cutoff=20)
Column Name Explanation
chr Name of the chromosome/scaffold
gene Gene ID and name
meanlen1 Mean length of 3′ ends to gene's start site in cell group 1
meanlen2 Mean length of 3′ ends to gene's start site in cell group 2
SDD Site distribution difference SDD∈[0,1]
p.value Statistical test p values
p.adjust Adjusted p values
> dp = scDAPAview(files=c('./result/1.anno','./result/2.anno'),alt_names=c('cell_A','cell_B'),gtf=gtf,gene_id='ENSG00000160062',legend.position = c(0.2,0.8))
> 
> # customize colour theme
> library(ggsci)
> dp + scale_colour_aaas()
> 
> # customize legend title
> dp + labs(colour = "Cell type")
> 
> # customize legend position
> dp + theme(legend.position = c(0.6, 0.9))
> 
> # customize simultaneuouly
> dp + scale_colour_aaas() + labs(colour = "Cell type") + theme(legend.position = c(0.6, 0.9))



[1]Tian B, Manley J L. Alternative polyadenylation of mRNA precursors[J]. Nature Reviews Molecular Cell Biology, 2016, 18(1):18.

[2]Abdelghany S E, Hamilton M, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads[J]. Nature Communications, 2016, 7:11706.

http://www.frasergen.com/cn/info_173.aspx?itemid=258

Congting Ye, Qian Zhou, Xiaohui Wu, Chen Yu, Guoli Ji, Daniel R Saban, Qingshun Q Li, scDAPA: detection and visualization of dynamic alternative polyadenylation from single cell RNA-seq data, Bioinformatics, , btz701, https://doi.org/10.1093/bioinformatics/btz701

高通量测序技术在可选择性多聚腺苷酸化研究中的应用

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容