宏基因组(metagenomics)
宏基因组学(Metagenomics)也称为元基因组学,是以样品中的微生物群落作为整体进行研究的学科。自然界中约有99%的微生物是不能在实验室条件下进行纯化培养的。宏基因组学研究不要求对每个微生物进行分离纯化培养,而是直接从样品中提取基因组DNA后进行测序分析。通过宏基因组测序,能够解释微生物群落多样性、种群结构、进化关系、功能活性及环境之间的相互协作关系,极大地扩展了微生物学研究范围。
目前宏基因组测序可以分为环境微生物多样性检测和宏基因组de novo测序。其中环境微生物多样性检测是指通过对环境中微生物16S rDNA高变区/ITS 的PCR扩增产物进行高通量测序,分析该环境下微生物群落的多样性和分布规律。宏基因组de novo测序是指对环境样品中所有微生物基因组DNA片段化后进行高通量测序,然后进行序列组装和基因注释,获得部分不可纯培养微生物的基因组序列,分析该环境下所有微生物基因集信息。
广义的metagenomics包括宏基因组测序和扩增子16S测序。16S测序相比宏基因组测序来说,价格更加便宜。利用16S技术对大量样本进行测序分析后,首先发现并阐明不同条件的样本间微生物组成以及多样性差异,然后挑选个别有代表性的样本,进行宏基因组测序,从而可以验证16S的分析结论、更加深入的阐明群落的功能情况,更好地说明微生物群落与环境之间的关系。可以简单的理解为,16S是指测了一部分的基因组的宏基因组。
宏基因组:宏基因组测序是指对微生物群体进行高通量测序(我的理解是因为很多情况下,微生物群落很难分离,所以只能一堆微生物一起拿来测序分析了),分析特定环境中微生物群体基因组成及功能、微生物群体的多样性与丰度,进而分析微生物与环境、微生物与宿主之间的关系,发现具有特定功能的基因。宏基因组测序无需分离纯培养微生物,较大扩展了微生物资源的利用,为环境微生物群落的研究提供了有效工具。宏基因组深度测序可以揭示或估计环境中真实的物种多样性和遗传多样性,挖掘具有应用价值的基因资源,应用于开发新的微生物活性物质。宏基因组研究分两个方向:扩增子测序和全基因组测序。
扩增子:扩增子(amplicon)为DNA或RNA扩增后的一段核苷酸序列。比如通过PCR扩增得到的某个基因的扩增片段。更简单的说,经过人工扩增的DNA片段或RNA片段、扩增产物。
扩增子测序,涉及特定序列位点的PCR扩增,通常是16S/18S rDNA。宏基因组的物种分类,一般用OUT(operational taxonomic unit),即可操作单元来表示。通常原生生物使用16S rDNA来衡量,真核生物的OUT使用18S rDNA来衡量。我的理解是,选取一段特别的DNA片段来测序,这段DNA还可以区分不同的菌落
为什么用16S,而不是其他15S或者17S呢
16SrRNA为核糖体的RNA的一个亚基,16SrDNA就是编码该亚基的基因。细菌rRNA(核糖体RNA)按沉降系数分为3种,分别为5S、16S和23S rRNA。16S rDNA是细菌染色体上编码 rRNA相对应的DNA序列,存在于所有细菌染色体基因中。16SrDNA是细菌的系统分类研究中最有用的和最常用的分子钟,其种类少,含量大(约占细菌RNA含量的80%),分子大小适中,存在于所有的生物中,其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。在大多数原核生物中rDNA都具有多个拷贝,5S、16S、23S rDNA的拷贝数相同。16S rDNA由于大小适中,约1.5Kb左右,既能体现不同菌属之间的差异,又能利用测序技术较容易地得到其序列,故被细菌学家和分类学家接受。
沉降系数:沉降系数(sedimentation coefficient)用离心法时,大分子沉降速度的量度,等于每单位离心场的速度。或s=v/(ω^2*r)。s是沉降系数,ω是离心转子的角速度(弧度/秒),r是到旋转中心的距离,v是沉降速度。沉降系数以每单位重力的沉降时间表示,并且通常为1~200×10的-13次方秒范围,10的-13次方这个因子叫做沉降单位s,即1s=10^-13秒,沉降系数对于生物大分子来说,多数在(1~500)×10^-13秒之间,如血红蛋白的沉降系数约为4×10的-13次方秒或4s。