Mammalian Endogenous Retroviruses
一篇 2015 年发表在 Microbiology Spectrum 上的综述,作者为英属哥伦比亚大学 Terry Fox Laboratory 的 Dixie L Mager 和英国 MRC National Institute for Medical Research 的 Jonathan P Stoye。
超过 40% 的哺乳动物基因组都含有逆转录的产物,其中一类含有长末端重复(LTR),这其中又包括了内源性逆转录病毒(ERV)。作者介绍了哺乳动物中 ERVs 的发现、分类和起源,并且介绍了一些宿主控制其表达的机制,以及 ERVs 对宿主的负面影响。文章也介绍了 ERV 蛋白对宿主的一些贡献,例如在胎盘发育过程中。此外,文章还列举了一些证据,支持 ERV LTRs 的基因表达调控能力在宿主的演化中得到了利用的观点。
完整的 ERV 序列指的就是和外源逆转录病毒整合进基因组的前病毒序列完全一致的序列,包含两个 LTR 序列,每个 LTR 序列由 unique 3' (U3), repeat (R), unique 5' (U5) 三部分组成,以及一个引物结合位点(pbs)、一个多嘌呤序列(polypurine tract, ppt)、完整的编码序列(包括 gag, pol 和 env 三个基因)、剪接供体(SD)和受体(SA)位点、一个 RNA 打包信号(RNA packaging signal, psi)。
solo LTR 在基因组中是丰度最高的。一般认为,它们是由于完全前病毒序列的 LTR 序列的同源重组导致序列丢失造成的。在一项 1988 年的研究中,研究人员持续进行了 5 年的实验,证明小鼠中与毛色变浅有关的 MLV 的重组删除频率为 4.5e−6 次删除 per meiosis。
检测 ERV 的试验方法主要可以分成两类。第一类是寻找有功能的活跃的 ERV,例如施加能激活 ERV 的诱导物质,再检测例如逆转录酶活性等能够代表逆转录病毒存在的指标,这种方法在多个物种中检测出了有感染能力的 ERVs,但是存在假阳性的问题,有时通过这种方法检测出的错误的致癌逆转录病毒被称为 "rumor viruses" ;第二类则是寻找 ERV 相关的序列,用探针进行检测,或者进行 PCR 扩增,能够检测不同物种中 ERV 的数目和多样性。
对 ERVs 的分类和命名一直是一个难题。作者详细地介绍了 ERV 的命名系统及其由来。最初是按照系统发育关系最近的外源逆转录病毒来命名,现在的标准则是在 ERV 前面加上一到两个表示宿主的字母,例如 HERV 表示首先在人类基因组上发现的 ERV;再在后面加上结合 PBS 位点的 tRNA 类型来进一步分类,例如 HERV-K 表示使用赖氨酸 tRNA 的人类内源性逆转录病毒。其他还有许多详细的规则,应对更复杂的情况。
ERV 在不同物种中有不同的类型和丰度,代表着动态的演化过程。
目前主要有两种估计特定 ERV 的年龄的方法,两种方法都是基于逆转录病毒复制的特性。第一种方法基于逆转录病毒的插入位点的随机性,认为位于同一位置的 ERV 起源于同一次插入事件,由此,根据一个位置的 ERV 在不同物种中出现的情况,可以初步地判断 ERV 插入的时间。第二种方法则是基于两端 LTR 序列的差异,在 ERV 刚整合到基因组中时,两个 LTR 序列必定是完全一致的,随后,突变会逐渐积累(按照宿主基因组的中性突变速率)。
宿主主要通过表观修饰以及产生蛋白限制因子的方式来抵抗 ERVs。
ERVs 对宿主可能有害,可能会导致癌症、生殖细胞突变、自身免疫失调等问题。但是也可能产生对宿主有利的蛋白质,或是对宿主的基因调控做出贡献。