Complete genome sequences ofStreptomyces spp. isolated from disease suppressive soils(Heinsch et al., 2019)在抑制病害土壤中分离的链霉菌的全基因组
一、摘要
二、综述节选
三、实验方法【现学现卖】链霉菌的全基因组分析(1)
四、结果
1. Isolation and phenotypiccharacterization of strains-菌株的分离和其表现特征
2. PacBio sequencing and assembly ofgenomes-基因组的PacBio测序与组装
3. Comparison of Illumina-corrected andPacBio-alone genome sequences-比较illumina改正前后的全基因组序列【现学现卖】链霉菌的全基因组分析(2)
4. General characteristics of the genomesequences-基因组一般特征
将菌株GS93–23 (8.24 Mb)和3211–3 (8.23 Mb)的染色体分别组装为一个大的contig,菌株S3–4 (4.19 Mb,3.31 Mb)组装为两个大的contigs,两个染色体臂(chromosome arms)可以通过GC-skew,rRNA操纵子的方向,染色体臂上特定代谢物基因簇的富集来定向(Fig 1)。作者尝试close gap,但是不成功。除了染色体基因组之外,菌株3211-3和S3-4分别含有两个大的线性质粒(3211–3:519 Kb,240 Kb;S3–4:349 Kb,203 Kb)。
用Prokka software tool进行基因注释,在GS93-23菌株中发现7188 CDSs,7 rRNA操纵子,66 tRNA,其他详见Table 1。
使用BASys平台分析基因产物直系同源群(COG)。通过EggNOG-mapper对蛋白质的功能进行分类,Table 2的第四列为模型生物S. coelicolor A3。
5. Annotation of natural productbiosynthetic gene clusters(BGCs)-天然产物生物合成基因簇的注释
用antiSMASH 3.0分析天然产物合成基因簇,结果见Table S1,表中最后一列注释的是比对为100%的基因簇。还有一些BGSs没有确切鉴定,表格中列出来的是一些可信度高的比对结果。
6. Comparison to closest sequencedrelatives-亲缘关系比较
将得到的draft genome与500个公开的放线菌基因组进行多位点序列比较,找到与每个菌株亲缘关系较近的。菌株S3–4归于Streptomyces katrae分支,并与菌株NRRL-ISP 5550亲缘关系最近。菌株3211–3在Streptomyces virginiae分支,与NRRL ISP-5094相近。GS93–23与Streptomyces lydicus type strain NRRL-ISP 5461相近,详见Fig 2。
将三个菌株基因组与对应的相近的数据库中菌株全基因组进行更多比对,Fig 3A中可看出来它们16S rRNA,rpoB和MLS相似度很高。
而后用Mauve对比了共享序列的数量,比如GS93-23与ISP-5461之间比对的gaps不均匀的分布在基因组中,大于100 bp的插入或缺失仅占整个基因组序列的4.5%(Fig 3B),在BGCs中插入或缺失的比例与基因组比例相似。
鉴于GS93-23与ISP-5461之间如此高的相似度,作者继续检测了基因组的微观水平进化(micro-scale evolution of these genomes),大概有40,000个SNPs,有趣的是SNPs的位置,SNP在Shine-Dalgarno sequence和CDS的5‘端存在不丰富(即保守,见图Fig 3C),与翻译起始有关。CDSs中约有33,000个SNPs造成沉默突变。在错义突变中,大多数在氨基酸化学方面是保守的(Fig 3D)。
同义突变与非同义突变的比率(dS / dN)为1.8,大大低于大肠杆菌中的管家基因和小肠链球菌的入侵基因的比率,这表明非同义突变受到的的选择性压力很小,这两个菌株属于同一克隆复合体。
尽管相近,但是它们仍然有一些实质性的差异,GS93-23有98个基因是ISP-5461没有的,而5461有11个独特的基因。GS93-23的98个独特基因中有66个的功能位置。而其他独有的与转录调控和代谢酶有关,5461也是。
其他两个菌株与相近的菌株差异更大一些,S3-4菌株中的质粒富含次生代谢产物相关基因,而与其相近的菌株不含质粒。3211-3菌株与其相近菌株B-1447相比,多了285个大的(>100bp)插入位点,309个大的缺失。
之后两两比较了三组菌株的可信度高的BGSs,仍然是GS93-23与ISP-5461中26个BGSs都能一一对应,其他两组稍低。
7. Signaling potential analysis-信号分析
一个具有高度拮抗作用的微生物群落的中可能具有一个关键的菌种,该菌种会产生一个信号,诱导其他成员产生抗生素。可以用基于平板的表型测定法检测菌株产生这种信号的可能。
作者选择前期实验得到的诱导抗菌表现最好的3211-3进行分子水平的分析,试图找出释放这种信号的菌株的基因组特征。
链霉菌之间的信号传导可通过几种著名的类激素信号分子介导,包括γ-丁内酯,呋喃,γ-丁烯内酯,SapB样RiPPs,二氨基苯(羟甲基)-丁二醇和二酮哌嗪。信号也可以通过亚抑制浓度的抗生素来介导。首先在3211–3中寻找编码类激素信号分子的BGC。该基因组中有两个γ-丁内酯BGC和一个SapB的BGC,但这个数目与其他测序的链霉菌相当,没有证据表明3211–3会产生异常多样化的激素样信号分子。
第二种可能是3211–3不会产生许多不同的激素样信号分子,但是它们产生的分子可以被许多链霉菌种感知。该属至少产生十五个独特的γ-丁内酯信号,不幸的是,不可能仅从序列信息中预测特定的γ-丁内酯化学结构。然而,从基因的角度,我们认为产生/感知相同化合物的生物合成/受体基因将比产生/感知不同化合物的那些具有更高的序列相似性(即功能相似的基因簇将具有更大的序列相似性),因为该基因簇与其他系统发育关系不密切(Fig 4)。用γ-丁内酯生物合成蛋白ScbA和受体AfsR对测序的链霉菌基因组进行了CLUSTER-BLAST分析。同样,我们没有看到任何证据表明3211–3产生了可以被更广泛接受的激素样信号分子。
第三种可能性是3211–3是一个多产的信号源(有38个可信度高的BGCs),产生了亚抑制浓度的抗生素(SICA)。与已知的125株链霉菌的BGCs数量相比,3211-3排名靠前。但是仍尚无明确的基因组特征可以解释3211–3中的信号传导潜力,需要更多实验。
文中出现的概念介绍