今天,分享一篇浙大樊老师和华大发表在Developmental Cell 上的,题目是“Spatiotemporal transcriptomic landscape of rice embryonic cells during seed germination”的文章。这个paper里利用单细胞和华大stereo-seq构建了水稻种胚的空间转录图谱。
=====实验设计=====
基于水分吸收和生理变化,作者把水稻种子吸胀之后的萌发分为三个阶段:0-24、24-48、48-72小时(HAI)。其中转录变化最显著的发生在0-24和24-48 HAI。所以作者取样的话,取了4个时间点:6、24、36、48 HAI。
=========结果==========
结果1:产生了水稻种胚的高质量单细胞和空间转录组数据
基于华大的stereo-seq收集了4个切片中的52个种胚组织切片,并利用华大可视化系统STOmics进行展示,用户可以通过他们的网址进行访问:http://ibi.zju.edu.cn/REGSTA/。
4个芯片上每个bin50上包含大约1200 UMI,平均基因数目为583个。为了避免不同时间点之间/采样之间的批次效应,作者最后从52个切片中选取了14个切片(分别来自6、24、36和48 HAI的4、4、3、3)进行后续的分析(附图1A)。
同时作者,还对4个时间点的样品进行了单细胞测序(图1A),总共获得了27099个细胞。过滤之后,获得了27070个细胞,包含37458个基因。从单细胞数据和空转数据的相关性来看,大概在0.5左右,可能主要是由于在原生质体准备过程中酶切造成的(附图1B)。
总的来说,作者从14个切片4个时间点样本中获得了高质量的空间转录组数据,同时获得了包含27070个细胞的单细胞数据,使得作者可以去探索在水稻发芽过程中的时空转录规律。
结果2:水稻胚乳的细胞自动分割
为了有效捕获每个cell的RNA,作者构建了一个自动化的胚乳细胞分割流程。作者首先使用FB染色技术可视化细胞壁。为了评估细胞分割的准确性,作者创建了一个具有清晰细胞壁染色信息的图像集作为训练数据。然后通过一些参数,比如DICE指数、预测和实际之间的面积,来平复细胞切割模型的准确性(图1B)。在测试的几个模型中,CP_embryo具有最高的准确性(图1C,1D)。和以往的bin模型(窗口模型)相比,作者这个流程可以检测出更多的cell,每个cell中有较少的基因数目。
并且,作者发现,使用细胞分割法,有助于减轻组织空隙对数据结果的影响。例如空隙中基因的表达和环境更为相似,而不是其它组织区域(图1E)。同时,细胞分割方法更有助于查看不同区域细胞尺寸的差异,因为水稻胚乳中的细胞尺寸差异较大。例如SCL2是最大的细胞,直径大约30mm,而PL和RA的细胞最小,直径仅仅为10um。而通过bin50方法发现PL区域的cell数目为9.2个,SC区域的cell数目为0.88。考虑到不同细胞的尺寸,每个bin的大小大概为25um,bin方法只能作为参考而已。
结果3:空间聚类以及细胞类型分类
根据组织学上的特征以及空间信息,作者把水稻的胚乳分成了5个区域(PL、RA、CO、SC和EP-CR)(图2A)。作者首先用Seurat进行了无监督空间聚类,以24 HAI的样品为例,基于bin聚类后,获得了13个不同细胞簇(图2A)。然后把这些簇映射到空间信息上,5个区域可以被分成13个细胞类型:PL、COL1,COL),RA,RAL3,EPCR,EP-CRL),LS,SCL1,SCL2,SCL1-2、SCL3,以及BESCL2。从空间分布来看,细胞类型和空间位置还是比较一致的(图2A)。根据以往其它胚乳切片的信息,还多一个细胞类型RC(root cap),所以总共有14个细胞类型。作者推断RC应该在4个时间点都存在的,但是由于截面角度问题,并不是所有时间点都能看到RC的结构。
基于作者建立的细胞分割流程,也基于无监督的方法进行了聚类和注释,并和bin的方法进行了比较。细胞分割方法总共捕获了5693个细胞,远高于bin方法的2398(图2B)。每个细胞平均检测的基因数目则是bin方法高于细胞分割,分别是649和163。基于聚类的分割方法,可以鉴定出上面13个细胞类型的9个(图2A)。这些结果表明,这两种方法都可以用于细胞类型的鉴定。基于Bin方法,不同细胞类型之间的reads数量有明显的差异。而基于细胞分割方法,则没有明显的差异。
为了确保细胞类型注释的准确性,作者验证了一些以往报道过的marker基因,例如qLTG3-1,已知在CR和EP区域表达。此外,通过不同细胞类型的差异分析,作者鉴定了不同细胞类型许多新的标记基因(图2C)。并通过 ISH验证了部分基因(图2D)。
作者发现LTP不同member具有细胞类型特异表达的特征。例如,OsLTP1.15和OsLTP1.2,参与调节细胞分裂,在PL中特异表达;OsLTP2.6主要在COL2中表达;OsHyPRP14/20是特异性的在EP-CR中表达。原位杂交(FISH)也证明OsHyPRP14在EP-CR区域中特异性且高度表达(图S2D)。OsLTP1.18、LTP、OsLTPG22,参与种子脂质的存储,主要在COL1中表达。这些结果表明不同的LTP通过调节脂质代谢在不同的细胞类型中发挥着不同的作用(图2E)。
有一些基因则在胚乳的特定细胞类型表达。例如OsLEA20, 编码一种晚期胚胎发生丰富的(LEA)蛋白,在RA中特异表达(图2E)。长链脂肪酸编码基因ONI1,与芽发育有关,在COL1中具有特定的表达模式。此外,一个同源基因CER1(OsCER1),调节花药发育和水稻质体分化,在发芽胚胎的PL中特异表达。GO富集结果表明,“DNA包复合体”等途径(p=4.39E 4)和“染色质的组装或拆卸”(p=2.19E4)在PL中富集,这意味着PL具有比较高的增殖能力。
结果4:SC区域细胞分裂和分化轨迹构建
从作者的分类来看,SC区域可以分成5个细胞类型(SCL1、SCL1-2、SCL1-3
SCL2、BESCL1-2和SCL3)。通过marker基因,作者鉴定了SCL1和SCL3(图3A)。编码半胱氨酸蛋白酶OsSAG12-1和α淀粉酶糖蛋白AMY1A在SCL1中特异表达(图3B)。SCL3代表SC中的维管束组织,由于切片的角度问题,这种细胞类型很难识别,作者幸运的在一些切片中看到这个类型(图3A)。有几个marker基因,比如SRZ1,编码锌指蛋白和SAMDC1,编码
S-腺苷甲硫氨酸脱羧酶在SCL3中特异表达(图2C)。
除了已知的SCL1和SCL3之外,空间转录组数据表明还存在其它三种细胞类型,既SCL1-2、SCL2和BESCL2。SCL2包含多种薄壁细胞层,位于PL附近。作者也鉴定了SCL2中特异表达的基因,如Os11g0496500和OsMFT2,并用FISH验证了OsMFT2(图3C)。以往报道证明OsMFT2通过调控ABA合成来影响种子的萌发。时间序列的空间转录组数据也表明OsMFT2从6到48 HAI的表达逐渐降低。对比野生型,OsMFT2敲除株系的发芽率显著升高(图3D),既达到30%的发芽率敲除株系种子需要30小时,而WT则需要96小时。这一结果表明OsMFT2降低了种子的休眠时间。和RNA-seq的联合分析表明在敲除株系中SCL2的比例明显小于野生型(图3E)。这个结果说明OsMFT2是SCL2区域的一个特异基因。
从解剖图来看,BESCL2和SCL2面积明显大于SCL1-2。BESCL2主要在SCL2的两端。SCL1-2主要在SCL1和SCL2中间。作者用marker基因OsCYS9验证了这一结果(图3B)。
为了更好的解析这三类细胞类型的功能,作者整合单细胞数据构建了其发育轨迹(图3F),同时鉴定了发育轨迹上关键的差异基因(图3G)。从结果可以看出,早期的细胞类型主要是SCL1-2,主要是肽合成相关的基因。在中间状态的主要是种子成熟以及乙醛裂解酶活性相关的基因。随后,余环境响应相关的额基因开始富集,主要在BESCL2细胞。
结果5:水稻种子萌发过程中的动态转录响应
作者接下来探索6、24、36、48不同时间点之间的动态差异。无监督聚类表明在所有的样本中有着相似的细胞类型构成(图4A),除了BESCL2、SCL3和EP-CRL1在6 HAI的样本中区分不开,RAL3在24-HAI样品中没有识别之外。不同重复之间的细胞比例没有明显差别,说明取样的稳定性。通过比较不同时间点之间的细胞比例,作者发现SCL2、RA、COL1、COL2有显著的变化(图4B)。随着时间推移,SCL2和LS的比例显著下降,而RA的比例则显著上升。
作者进一步使用Mfuzz的对不同细胞类型的4个时间点进行聚类,并鉴定了不同时间点的marker基因(图4C)。与细胞壁组成、微管相关的途径、气孔发育、芽系统形态发生、表皮形态发生的途径在萌发过程中持续升高(图4C)。温度和水的响应、阳离子结合和叶绿体包膜特征等相关的基因从6到24HAI剧烈下降,随后不变。细胞周期、ATP酶活性和有丝分裂和DNA修复相关的基因从36-HAI开始升高,这些结果意味中从36-HAI开始细胞增值和细胞周期开始加强。
结果6:激素以及营养的细胞类型特异调控
在水稻种子萌发的过程中植物激素调节了营养代谢。通过结合空转和单细胞数据,作者发现生长素和GA以及脂质转运的基因从6-48时间点逐渐升高。而ABA则是显著下降。淀粉酶基因则是从6到36上升,然后下降(图5A)。这些结果和种胚萌发过程的RNA-seq的结果是一致的。空转数据使得我们可以探索不同细胞类型响应的差异。淀粉酶基因主要在SCL1和SCL-2中表达(图5B和5C)。通过查看激素信号,作者发现auxin合成相关的基因主要在PL和RA中高表达。而通过查看转录因子的情况,发现几个转录因子家族(NAC、LBD、HSF等)在PL和RA中特异表达,并且和auxin的pattern相反。GA主要在LS和EP-CR中高表达(图5B)。