提高扩增子物种鉴定分辨率利器：Oligotyping

什么是oligotype ?

寡核苷酸: 是一类只有20个以下碱基的短链核苷酸的总称（包括脱氧核糖核酸DNA或核糖核酸RNA内的核苷酸），寡核苷酸可以很容易地和它们的互补链对接，所以常用来作为探针确定DNA或RNA的结构，经常用于基因芯片、电泳、荧光原位杂交等过程中。

寡核苷酸配型技术(Oligotyping)：是一种新型监督计算方法，利用16SrRNA基因扩增子reads中非常微妙的核苷酸变异来分解微生物群落中非常密切相关的分类群。它可以揭示以前未被发现的生态模式以及在环境样品中隐藏的微生物多样性。

通过寡聚分型，高变区不同类型之间的相似性阈值可以低至0.2％，比目前正在使用的OTU聚类方法的3％相似性阈值更低。

什么时候用

各种环境中采集的多个样品产生的16SrRNA基因标签序列来研究横截面或时间序列差异。对16SrRNA reads进行分类（或聚类）分析，您就知道样品的物种组成（OUT_table）。如果一个分类单元（或OTU）在每个样本中都有，并且您怀疑这个分类单元（或OTU）的内容多于满足目标的情况，您认为该单元可能有多种类型被分解成。 Oligotyping可以帮助你调查这个问题，并且大部分情况下都伴随着令人惊讶的答案。

Are all Firmicutes in all samples the same?
if there are different types, how are they distributed?

Oligotyping使用香农熵识别生物相关性，在概念上不同于广泛使用的依赖于成对序列相似性的方法。香农熵是一种衡量信息含量的指标，用于确定显示高度变异的核苷酸位点。寡聚分型利用这一事实，即在基因的特定位置发生系统发生上重要的差异，导致这些位置的高度变异，而许多测序错误在一级近似中沿着序列随机分布。只有高信息核苷酸位置的连接定义了寡核苷酸，然后用于将测序数据划分成高分辨率组，同时丢弃冗余信息和噪声。通过这种方法，寡核苷酸分型技术可以鉴定在测序区域内与单个核苷酸差异很小的分类群。

怎么用

Flowchart

python q2oligo.py rdp_assigned_taxonomy/all_rep_set_tax_assignments.txt  otu_map.txt   all.fna   'Mitochondria'  # 找出'Mitochondria 物种所在的OTU以及序列编号

结果文件

o-trim-uninformative-columns-from-alignment #
o-get-sample-info-from-fasta Mitochondria.fasta # 序列的信息

结果文件

oligotype 分析要求fasta序列长度一致

o-pad-with-gaps Mitochondria.fasta  #对长度不一致的序列用--填补

结果文件

entropy-analysis Mitochondria.fasta-PADDED-WITH-GAPS  # 生成序列香农熵文件

结果文件

Firmicutes1.fasta-ENTROPY.png

根据这一步的文件来确定下一步分析的参数

oligotype Mitochondria.fasta-PADDED-WITH-GAPS Mitochondria.fasta-PADDED-WITH-GAPS-ENTROPY -c 2 -M 10 --quick

Mitochondria-c5-s1-a0.0-A0-M10/
├── COLORS
├── ENVIRONMENT.txt
├── FIGURES
├── MATRIX-COUNT.txt # actual number of reads per oligotype / sample pair
├── MATRIX-PERCENT.txt
├── OLIGO-REPRESENTATIVES # contains all essential files about each individual oligotype
├── OLIGOS.fasta
├── OLIGOS.nexus
├── READ-DISTRIBUTION.txt
├── RUNINFO
├── RUNINFO.log
└── TMP

o-stackbar.R  Mitochondria-c2-s1-a0.0-A0-M10/ENVIRONMENT.txt -o Mito --title Mitochondria

visualize your results

这是一个重要的结果，表明我们区别了2个不同的菌株，它们在16S rRNA基因区域上99％相同。

研究案例

Oligotyping analysis of the human oral microbiome

寡型链球菌在个体样品中的分布。（A）每个采样点V3-V5中8个链球菌寡型的相对丰度，在所有志愿者中平均值。为了简单起见，仅显示与HOMD链球菌参考序列完全匹配且在至少一个口腔位点中具有至少0.2％平均丰度的寡聚体。显示寡核苷酸类型的物种名称是HOMD中相同命名序列的名称; 这些寡核苷酸中的一些还与另外一个未命名的分类群相同，只有一个HOT名称（在数据集S2中列出）。（B）显示每对寡核苷酸之间核苷酸同一性百分比的热图表示。（C）每个志愿者都表示为一列，显示每个志愿者9个口腔位点每个寡核苷酸对链球菌群体的相对贡献。列的顺序由具有Morisita-Horn不相似性指数的SV样本的聚类来定义。

Oligotyping: differentiating between closely related microbial taxa using 16S rRNA gene data

由Yatsunenko等人（2012年）发表研究推断拟杆菌寡型分布。柱形图表明在给定的分组中存在一种寡聚型；全长条代表100％分析样品中出现寡聚体，下面板放大包络图中编号的区域。数字1,2和3是巴氏杆菌寡聚体，其全长相似性超过97％，但在其地理分布上表现出显着的差异。浅黄色标出了NCBI非冗余核苷酸序列数据库中完美匹配的寡聚型。数字4表明几种寡聚型在马拉维和美洲印第安人社区的样本中一直存在，但在美国的样本中不存在。第4号中的所有寡核苷酸都没有在NCBI的nr数据库中完美匹配。另一方面，数字5显示了马拉维和美洲印第安人社区中具有相似发生模式的几种寡聚体，其中第4种显示了这些寡聚体，但在从美国收集的样品中存在着更大的丰度。与第4号相反，第5号中列出的4个同型中有3个在NCBI的nr数据库中完美匹配。

[1]Oligotyping: differentiating between closely related
microbial taxa using 16S rRNA gene data
[2]Oligotyping analysis of the human oral microbiome
[3]Dynamics of tongue microbial communities with single-nucleotide resolution using oligotyping
[4]oligotyping-pipeline
[5]GitHub_oligotyping
[6]expanded Human Oral Microbiome Database (eHOMD)
[7]machine-learning-in-action
[8]q2oligo
[9]Linux系统中NCBI BLAST+本地化教程
[10]python中cPickle用法
[11]OLIGO Primer Analysis Software
[12]Rpackages: oligo
[13]Oligotyping reveals differences between gut microbiomes of free-ranging sympatric Namibian carnivores (Acinonyx jubatus, Canis mesomelas) on a bacterial species-like level

开发者肖像meren

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,530评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,403评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,120评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,770评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,758评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,649评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,021评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,675评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,931评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,751评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,410评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,004评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,969评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,042评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,493评论 2赞 343

提高扩增子物种鉴定分辨率利器：Oligotyping

什么是oligotype ?

什么时候用

怎么用

研究案例

推荐阅读更多精彩内容