【转】单倍型基因组组装方法

1. 什么是单倍型?

image

同源染色体:同源染色体,一个来自母本,一个来自于父本。

单倍型:单倍体基因型的简称。遗传学上指在单条染色体上一系列遗传变异位点的组合。

2. 单倍型组装的意义?

目前,大多数二倍体基因组组装都忽略了同源染色体之间的差异,将基因组组装成一个假的单倍体序列,这是二倍体类型的组装的人为共识。这种人为的共识可能导致基因注释的不精确和生物学解释的错误。

为了深入研究的需要,更多的物种需要将来自父母的遗传信息都获得,因此参考基因组就需要获得两个单倍体基因组,也就是单倍型基因组。

目前单倍型技术主要应用领域包括:

  • 在医学上探索致病机理,挖掘致病基因,寻找疾病治疗新方法;
  • 在群体遗传学上分析等位基因间差异,追踪个体亲缘关系,了解生物迁徙模式和进化历史;
  • 在农业上发掘优异等位基因变异,探索杂种优势理论等。

3. 如何进行单倍型组装?

早期已经提出了几种算法来生成单倍型解析的程序集,也称为分阶段程序集。FALCON-Unzip,Supernova等使用相对短距离的序列数据进行定相,但只能解析高达9Mb的单倍型人类样品。这些方法无法逐步完成着丝粒或长重复。扩展FALCON-UnzipFALCON-Phase使用Hi-C连接相控序列模块,可以生成更长的单倍型,但无法实现染色体长的定相。

近年出现了几种有效的单倍型组装方法。

方法1:Trio-binning (Illumina+Pacbio)

由美国国家人类基因组研究所、Pacific Biosciences公司及阿德莱德大学等单位的研究人员开发,发表在2018年10月22日的Nature Biotechnology杂志上。

Trio binning首先使用来自两个亲本基因组的高精度短读长数据将子代的长读长序列划分为单倍型特异性的集合,然后每个单倍型独立组装,形成一个完整的二倍体重建。

组装方法

image
  • 1)测序:两个亲本分别二代Illumina测序,对F1代进行三代PacBio测序。
  • 2)分割三代数据:使用两个亲本的二代数据获取单倍型特异性k-mers。利用特异性k-mer将三代数据分割
  • 3)利用分割的数据分别组装

优缺点

Trio binning是一种简便、准确、高效的二倍体参考基因组组装方法。在拟南芥、人类及牛单倍型组装中表现良好,但Trio binning对样本具有很高的要求,必须能够获取双亲的二代数据。

在进行数据分割时一部分杂合子reads不能明确地划分为亲本单倍型:如果双亲在某个位点上都是杂合,那么这个位点无法给reads提供有效的kmer信息,并且不能被唯一地分配给一个亲本单倍型;同样如果父本在一个位点是杂合子,而母本是纯合的,从母本单倍型来看也不能分割。在标准的trio-binning中,不能被区分的杂合reads在两个亲本数据集中都会使用。因此,这两个等位基因可能存在于一个单倍型组合中,并引入错误。另外还可能存在将reads错误划分到其中一个亲本的情况。

方法2:DipAsm(HiFi+Hi-C)

由李恒、Evan E. Eichler、George M. Church等人联合开发的新的基因组组装方法,发表在2020年12月7日的Nat Biotechnol 杂志上。

DipAsm使用HiFi数据和Hi-C数据,可以在1天之内生成染色体规模的分相组装,具有98-99%的准确性。

组装方法

image
  • 1)Peregrine:Pacbio HiFi reads 组装成不分相位的congtig;
  • 2)HiRise / 3D-DNA:结合Hi-C数据生成不分相位的scaffold;
  • 3)DeepVariant :Hi-C reads mapping到scaffold上call 杂合snp;
  • 4)WhatsHap和HapCUT2:处理HiFi reads和Hi-C reads杂合snp;
  • 5)WhatsHap:根据相位分割reads;
  • 6)Peregrine:分割的reads分别组装。

优缺点

DipAsm将促进高质量的精准医学以及个体单倍型变异和种群多样性的研究,但DipAsm使用SNP信息进行定相,这对于长度长数据准确性要求高,也就是需要使用 PacBio HiFi,否则将增加SNP的错误率,部分涉及长SV的高度杂合区域会出现错误。

方法3:strand seq + long reads

由德国杜塞尔多夫海因里希·海涅大学Tobias Marschall和美国华盛顿大学Evan E. Eichler合作,使用单细胞链测序和长读取实现了亲本数据非依赖的全阶段人基因组组装,2020年12月7日发表在Nature Biotechnology上。

组装方法:

Strand-seq具有三个重要功能:

  • 1)它可以按染色体对reads或contig进行排序;
  • 2)它可以定序和定向contig;
  • 3)它提供了一个染色体范围内的相位信号,而与物理距离无关。
image

步骤:

    1. 使用长reads组装成不分相位的contig;
    1. Strand-seq比对到congtig上,contig进行排序和连接,形成染色体;
    1. 长reads mapping到 染色体上call SNVs;
    1. WhatsHap:利用SNVs 分割长reads;
    1. wtdbg2 , Flye, Canu or Peregrine2:分割的reads分别组装。

优缺点:

组装准确(质量值> 40)且高度连续(contig N50> 23 Mbp)、转换错误率低(0.17%)、并可提供了全相单核苷酸变体、插入缺失和结构变体等。

Strand-seq是一种单细胞技术,它不需要亲本或配子,这种技术利用基因图谱技术对染色体、单倍型和scaffold的长序列进行聚类; 然而,生成Strand-seq数据的困难限制了它在少数模型物种中的应用。

转自《百迈克》推文

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容