“ Annotation and cluster analysis of spatiotemporal- and sex-related lncRNA expression in Rhesus macaque brain”,这篇文章是2017年发表在Genome Research上的,文章主要讲了lncRNA在普通猕猴脑的不同区域、不同年龄段及性别间的异质性。
猕猴与人的DNA序列存在93%的相似性,2500万年前与人类有着共同的祖先,其基因组序列在2007年完成,是第二个完成测序的灵长类(from wiki),平均年龄25岁。作者测了 4个年龄段的恒河猴:1年(child),4年(Youth),10年(Adult)和20年(Old); 8个脑组织区域包括:5个大脑皮质区(PFC, PCC,TC,PC,OC)、2个海马区(CA1和DG)和小脑(CB),两种测序模式(RNA-seq and CAGE-seq),两种性别,总计(4X8X2X2)128个样本。
PS: 被中国克隆猴的成功刷屏了,顺便看看此类猴与中中华华的种属关系吧,此研究中的猴学名Macaca mulatta,通常所说的普通猕猴或恒河猴,中中和华华的学名是Macaca fascicularis,即食蟹猕猴,也称长尾猕猴),都属于猕猴属(Macaca),不同的种。
文章分析思路主要包括以下5方面:
1)差异表达分析:包括lncRNA与mRNA的差异,以及 lncRNA在时间维度、脑皮质不同区域和性别间的差异;
2)共表达及聚类分析:WGCNA分析将3635 个lncRNA和7070mRNA分别分成18个lncRNA模块和14个mRNA转录模块;由计算Pearson相关系数(PCC>=0.7,P-value<=0.01),共得到3,341,261共表达lncRNA-mRNA pairs,如有237个mRNAhe 93个lncRNA与MIAT共表达。
3)功能分析:对所有与lncRNA模块相关的mRNA进行GO和KEGG富集分析;
4)CAGE-Seq:分析lncRNA转录起始位点(TSS)。
5)同源性分析:作者下载了NONCODE中 macaque(9,325), gorilla(20,785), human(141,353),mouse(117,405)的lncRNA数据,然后和macaque脑中的lncRNA进行比较分析。
具体方法:
质控:FASTX-Toolit
比对:TopHat2,allowing two mismatches
组装:Cufflinks
差异基因分析:edgeR
基础知识补充:
CAGE-Seq (cap-analysis gene expression): 主要用于精确判断启动子区域转录起始位点,还可用于用于研究RNA表达量。原理是首先通过随机引物反转录,加生物素标签,抽取出加帽转录物的5‘端小片段,然后反转为cDNA。详细介绍可以参考官网和illumina。
https://www.illumina.com/science/sequencing-method-explorer/kits-and-arrays/cage-seq.html
NONCODE数据库:NONCODE数据库包括17个物种(human, mouse, cow, rat, chicken, fruitfly, zebrafish, celegans, yeast, Arabidopsis, chimpanzee, gorilla, orangutan, rhesus macaque, opossum platypus and pig)除了tRNA和rRNA的所有non-coding RNA, 支持多种ID格式搜索ncRNA的信息,还可以进行ID转换,鉴定lncRNA, 下载功能,包括noncoding RNA的序列,lncRNA的class code, lncRNA 基因的bed格式等信息,另外功能预测只支持人和鼠,疾病预测只支持人。
,