植物泛基因组101（第二期）

继上次介绍完泛基因的基本概念，构建泛基因组序列的不同策略和最近发表的一系列高分文章后，本次推文主要来谈谈目前植物泛基因组研究中的一些局限。 (如果还没有看过上期文章的小伙伴，欢迎点击下面链接进行一下回顾)。

无标准化分析流程

在Tao等人的有关植物泛基因组分析的综述论文中，作者从不同角度比较了目前植物泛基因组分析的特点（见下表）。从中可以看出，不同研究中使用到的样本数量（3_{>3000），测序(1X}>110X），构建泛基因组的策略，序列注释方法以及判断基因有无变异（PAV）的方法都有很大的差别。这导致了即使对同一种物种来讲，不同实验室构建的泛基因组序列及基因有无变异结果不能进行直接的比较；在不同物种之间，也无法从系统进化的角度分析基因在植物进化及农作物驯化等生物过程中的基因流失或基因复制等现象。所以，植物的泛基因组分析亟需建立一套操作方便，结果精确，可移植性强的流程，包括样本量的选择，基因组的测序、组装，泛基因组的构建，序列注释等一系列生物信息学标准化分析流程。

技术的局限性

目前，大多数的植物泛基因组分析中使用的都是基于短读长的二代测序数据。但是，短读长序列的一个缺点是对重复序列区域的组装并不理想。而现有的植物泛基因组分析结果表明，非参考基因组序列很大一部分是有重复序列组成。所以，目前的泛基因组序列大都是一些长度较短的，高度碎片化的序列构成。一方面，这些重复序列的组装结果并不准确，另外一方面，组装出来的序列中的基因都是片段化的。非完整的基因序列为下游的基因有无变异分析带来偏差，无法得到正确的基因有无变异图谱。

相比之下，基于单分子实时的第三代测序技术能够产生较长的读长，能够跨过某些重复序列，从而在一定程度上解决泛基因组分析中的重复序列问题，从而产生更加精准的基因有无变异图谱。但是，目前来讲，三代测序技术测序错误率较高，通量较低，价格较贵，还无法应用于大规模的群体遗传学研究中。随着技术的不断发展，一些技术壁垒被突破，如目前的CCS长读长序列的测序准确度已经超过99.8%（Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome，2019，NBT），这为准确获取个体基因组的序列提供了技术的支持。相信随着三代测序技术的发展和普及，我们可以构建更加完整的植物泛基因组序列。

应用的局限性

泛基因组分析分析包括两个主要的内容，一是构建泛基因组序列，二是基于泛基因组的基因有无变异分析，建立泛基因组序列的基因浏览器，及后续的应用研究。目前，大多数的植物泛基因组研究的重点放在第一部分。

在第二部分中，目前大多泛基因组的应用就是构建一个泛基因的数据库。数据库里面主要是包含了新发现的基因的基本信息，还有这些基因与RNA-seq比对的信息，在不同群体中基因出现的频率等相关信息。泛基因组中，新发现(新组装出来参考序列没有)的基因可以进一步用于功能分析，下游的湿实验通路研究，基因选择育种等一些的应用中。目前在建立泛基因数据库这一块，做的最好的有数，RPAN: Rice Pan-genome Browser。

但实际上建立数据库只是泛基因最基本的应用，对于实际的育种帮助还是处于很基础的阶段。为什么这样说呢？在上次番茄泛基因组发表之后，各路植物基因学术界的大牛都在推特上议论一番。其中有大牛一针见血的提出了目前植物泛基因研究最大的局限。他说道“他所认同的泛基因组，并不是单纯的将成百上千个个体进行测序比对，然后将所有比对不上参考基因组的 reads组装成一推新的contigs，然后将其和参考基因组拼接成泛基因组。这些新的contigs既不能准确的放回到参考基因组中，进而进行基因定位克隆，更下游的分析，并且运用于育种中。也不能很准确的代表该物种所有个体的基因多样性。他理想中的泛基因组是类似一个图谱型的基因组，在每个变异位点上展示，所有个体的基因（各种突变）序列信息。”

推特上的讨论很准确的总结了，目前泛基因组在农业育种方法应用的最大阻碍。尽管如此，八月份在自然—生物技术发表的一篇文章"HISAT2和HISAT基因型的基于图谱型基因组比对和基因分型"为图谱型泛基因组的出现带来了曙光，随着数据的结构与分析流程的改进，未来泛基因组定会更好的运用于育种当中。

另外关于泛基因组未来的一些分析的思路，可以参kaolvLi Heng博客中的想法，这里就不深入具体探讨了：
http://lh3.github.io/2019/07/08/on-a-reference-pan-genome-model
http://lh3.github.io/2019/07/12/on-a-reference-pan-genome-model-part-ii

小结

由于当前技术或者其它因素的影响，当前泛基因组的研究在农业育种应用具有一定的局限性，也欠缺相对可比性。但随着三代技术的发展，和图谱型基因组的普及，植物泛基因组定会在未来迎来更快的发展，继续成为测序研究的热点话题。

最后感谢上海交通大学的段博士的修改与润色

参考文献

Tao, Yongfu, et al. "Exploring and exploiting pan-genomics for crop improvement." Molecular plant (2018).
Kim, Daehwan, et al. "Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype." Nature biotechnology 37.8 (2019): 907-915.
Wenger, Aaron M., et al. "Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome." Nature biotechnology (2019): 1-8.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,530评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,403评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,120评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,770评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,758评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,649评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,021评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,675评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,931评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,751评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,410评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,004评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,969评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,042评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,493评论 2赞 343

植物泛基因组101（第二期）

无标准化分析流程

技术的局限性

应用的局限性

小结

推荐阅读更多精彩内容