1.完全基因组
在去年5月发表的预印本中,人类共有基因组序列 GRCh38 添加了近 2 亿个新碱基对,并撰写了人类基因组的最后一章。
GRCh38 于 2013 年首次发布,一直是一个有价值的工具,但也存在漏洞。主要是因为测序技术产生的读数准确但较短。它们的长度不足以明确地绘制出高度重复的基因组序列,包括覆盖染色体末端的端粒和在细胞分裂过程中协调新复制的 DNA 分配的着丝粒。
长读长测序技术可以在一次读取中对数万甚至数十万个碱基进行测序,这项技术刚开始兴起时,测序有时会存在错误
。但当T2T 团队在 2020 年重建他们的第一条个体染色体(X 和
8)时,测序已经发展到可以检测到长段重复序列中的微小变化的程度。这些微妙的“指纹”使长的重复染色体片段易于处理,基因组的其余部分很快就排成一行。
ONT 平台还捕获了许多调节基因表达的 DNA 修饰,T2T 也能够在全基因组范围内绘制这些“表观遗传标签”。
2. 蛋白结构确定方案
过去两年的重大实验和计算进步为研究人员提供了互补的工具,以前所未有的速度和分辨率确定蛋白质结构。
AlphaFold2
结构预测算法依靠“深度学习”策略从其氨基酸序列中推断折叠蛋白质的形状。如今,AlphaFold2已应用于蛋白质组,以确定在人类 6 和 20
种模式生物中表达的所有蛋白质的结构以及近 440,000 种蛋白质的结构。Prot
数据库,大大增加了可用高置信度建模数据的蛋白质数量。AlphaFold2算法也证明了它处理多链蛋白质复合物的能力。
与此同时,低温电子显微镜
(cryo-EM)
的改进使研究人员能够通过实验解决更复杂的蛋白质和复合物。Cryo-EM使用电子束扫描快速冷冻的分子,生成多个方向的蛋白质图像,然后可以通过计算重新组装成
3D 结构。2020年,cryo-EM 硬件和软件的改进使两个团队能够生成分辨率低于 1.5 埃的结构,捕获单个原子的位置
8,9。但这些研究表明,近原子分辨率对于其他更困难的目标也是可行的。
3. 量子模拟
量子计算机以量子比特的形式管理数据。使用称为纠缠的量子物理现象耦合在一起,量子位可以在一定距离内相互影响。相对于经典计算机中同等数量的比特,这些量子比特可以极大地提高计算能力,而这可以通过给定的量子比特分配来实现。
研究小组已经成功地将单个离子用作量子比特,但它们的电荷使它们难以以高密度组装。使用光学镊子将不带电的原子精确定位在紧密排列的
2D 和 3D 阵列中,然后应用激光将这些粒子激发成大直径的“里德堡原子”,并与它们的邻居纠缠在一起。
“里德堡原子系统是单独可控的,它们的相互作用可以打开和关闭。
4. 精确的基因组操作
大多数遗传疾病的治疗需要的是基因校正而不是破坏,需要利用CRISPR
的精确定位,同时限制Cas9在该位点切割 DNA的能力。第一种称为碱基编辑,它将催化受损形式的 Cas9
与一种酶结合,这种酶有助于一种核苷酸化学转化为另一种核苷酸——例如,胞嘧啶转化为胸腺嘧啶或腺嘌呤转化为鸟嘌呤。但目前只能使用此方法做某些基础到基础的更改。将
Cas9 与一种称为逆转录酶的酶结合起来,并使用一种经过修饰的引导 RNA,对基因组序列编辑。通过多阶段生化过程,这些成分将引导 RNA
复制到 DNA 中,最终取代目标基因组序列。碱基编辑和原始编辑都只切割一条 DNA 链,这对细胞来说是一种更安全且破坏性更小的过程。
5. 靶向基因治疗
基于核酸的药物可能会在临床上产生影响,但它们在可以应用的组织方面仍然受到很大限制。
腺相关病毒是许多基因治疗工作的首选载体,动物研究表明,仔细选择合适的病毒与组织特异性基因启动子相结合,可以实现有效的的递送。然而,病毒有时难以大规模生产,并且会引发免疫反应,从而破坏疗效或产生不良反应。
脂质纳米颗粒提供了一种非病毒替代品,过去几年发表的几项研究强调了调整其特异性的潜力。如果对脂质纳米颗粒进行系统筛选并开始改变它们的组成,可以改变生物分布。
6. 空间多组学
单细胞组学发展的爆炸式增长意味着研究人员现在可以常规地从单个细胞中获得遗传、转录组、表观遗传和蛋白质组学的见解——有时是同时进行的。但是单细胞技术也通过将这些细胞从其原生环境中剥离出来而丢失了关键信息。
2016 年,研究人员用带有条形码的寡核苷酸(RNA或DNA的短链)的载玻片,可以从完整的组织切片中捕获信使RNA,这样每个转录本就可以根据其条形码被分配到样本中的特定位置。空间转录组学领域从此爆发。
现在,研究人员正在他们的空间地图之上进一步分层“组学见解”。DBiT-seq16
平台采用了一种微流体系统,可以同时为数千个 mRNA
转录物和数百个用寡核苷酸标记的抗体标记的蛋白质生成条形码,与仅从转录组数据中获得的数据相比,这可以更准确地评估细胞基因表达如何影响蛋白质的产生和活性。
7. 基于 CRISPR 的诊断
CRISPR-Cas
系统精确切割特定核酸序列的能力源于其作为抵抗病毒感染的细菌“免疫系统”的作用。但并非所有的 Cas 酶都是一样的。Cas9 是基于
CRISPR 的基因组操作的首选酶,但实际上,CRISPR诊断工作中使用更多的是Cas13。Cas13 使用其 RNA 向导通过碱基配对识别
RNA 靶标,并激活核糖核酸酶活性,可通过使用报告 RNA 将其用作诊断工具。许多基于 Cas13
的诊断方法使用一种报告RNA,该RNA将荧光标签连接到抑制荧光的猝灭剂分子上。当 Cas13 在识别病毒 RNA
后被激活时,它会切割报告基因并从猝灭剂中释放荧光标签,从而产生可检测的信号。一些病毒留下了足够强的“信号”,可以在不放大的情况下进行检测,从而简化了即时诊断。
现已经开发出基于 CRISPR 的工具,可以同时检测超过 169 种人类病毒。其他 Cas 酶可以充实诊断工具箱,包括 Cas12 蛋白,它们表现出与 Cas13 相似的特性,但靶向的是 DNA 而不是 RNA。总的来说,这些可以检测更广泛的病原体,甚至可以有效诊断其他非传染性疾病。
参考文献:Nature technology feature "Seven technologies to watch in 2022"