第10周-单细胞看小鼠肝脏发育

单细胞看小鼠肝脏发育

肝脏背景知识

肝脏是一种多倍体器官,由具有一个或两个细胞核的肝细胞组成,每个细胞核含有2,4,8或更多单倍体染色体组。

肝脏 是人体新陈代谢最旺盛的器官,负责着各种生理反应,像一个巨大的“化工厂”。除了代谢功能之外,肝脏还负责肝脏 还负责分泌胆汁、清除身体的毒素、表达血液中主要的载体蛋白以及免疫防御。

肝细胞在功能上是异质性的,以前的研究根据代谢区带(metabolic zonation)可以将其分成两个不同的群体:肝脏 门静脉周围的肝细胞和肝静脉周围的肝细胞。

肝脏单细胞文章

Itzkovitz教授团队与免疫学Ido Amit教授课题组合作,分析了1500个肝脏细胞的基因组信息。他们针对20000个基因构建了它们的表达图谱。同时,他们还试图可视化整个肝脏组织,在荧光显微镜下标定所有信使RNA。文章是:

  • Halpern KB, Shenhav R, Matcovitch-Natan O, Toth B et al. Single-cell spatial reconstruction reveals global division of labour in the mammalian liver. Nature2017 Feb 16;542(7641):352-356. PMID: 28166538

2017年的这篇nature文章数据在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE84498 共测量了肝脏的26个不同部位的 1736 个单细胞的表达数据。表明肝脏细胞至少可分为9种不同的类型,每一种都行使着自己的职责。”

去除了非薄壁组织细胞(non-parenchymal)之后,把肝脏细胞分成3大类:

  • the Kupffer cell genes: Clec4f, Csf1r, C1qc, C1qa and C1qb
  • the endothelial cell genes: Kdr, Egfl7, Igfbp7 and Aqp1
  • the hepatocyte genes: Apoa1, Apob, Pck1, G6pc and Ttr.

使用的是MARS-seq单细胞转录组建库技术:

数据处理文章描述如下:

  • Mapping of single-cell reads to mouse reference genome (mm9) was done using HISAT version 0.1.6 and reads with multiple mapping positions were excluded.
  • Reads were associated with genes if they were mapped to an exon defined by a reference set obtained from the UCSC genome browser.
  • Exons of different genes that share genomic position on the same strand were considered as a single gene with concatenated gene symbol.
  • Corrected read counts were evaluated based on unique molecular identifiers (UMI)

肝小叶背景知识

肝小叶是组成肝脏结构的基本单位,呈六角轮柱状,由肝细胞、毛细胆管、肝血窦和相当于毛细淋巴管的窦周隙(狄氏间隙)组成。研究人员发现,肝小叶不同层分别执行不同的功能。具体而言可分成:肝小叶的外层负责合成葡萄糖、凝血因子以及其他各种化合物,该区域富含合成反应所需的氧元素;内层负责降解毒素及其他物质;中间层合成并分泌铁调素(hepcidin)。

荧光显微镜下小鼠肝小叶结构的横截面:中间层富含信使RNA分子(白点),这些基因最终表达生成铁调素(Hepcidin)。

重点分析得到了3496个zonated genes

统计检验表明,在全部的7227个肝脏表达基因里面,有3496可以被定义为 zonated genes ,远超预期。它们对应着 肝小叶的外层到内层。

  • 在Apc-KO小鼠表达显著下降的基因有 中心周围的 pericentral 倾向 (810 of our 3,496 zonated genes)大多数集中在肝小叶的第一层
  • 在Apc-KO小鼠表达显著下降的基因有 门静脉周的 periportal 倾向 (193 of our 3,496) 大多数集中在肝小叶的第六层
  • 近三分之二的(2,314 out of 3,496 genes) were not predicted targets of either Wnt, hypoxia, Ras signalling or pituitary hormones

还利用了几个公共数据:

首先下载原始数据

https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=SRP078795 可以找到所有原始测序数据。

脚本如下:

# nohup bash prefetch.sh srr.list &
while read id
do
echo $id
~/biosoft/sratoolkit/sratoolkit.2.8.2-1-centos_linux64/bin/prefetch $id 
done <$1

下载得到的sra文件需要转换为fastq文件

2.6G Feb 27 11:16 SRR3928573.sra
2.2G Feb 27 11:18 SRR3928574.sra
2.5G Feb 27 11:20 SRR3928575.sra
2.4G Feb 27 11:22 SRR3928576.sra
2.8G Feb 27 11:24 SRR3928577.sra
2.9G Feb 27 11:26 SRR3928578.sra
2.3G Feb 27 11:28 SRR3928579.sra
2.2G Feb 27 11:31 SRR3928580.sra
1.2G Feb 27 11:32 SRR3928581.sra
1.2G Feb 27 11:34 SRR3928582.sra
1.1G Feb 27 11:35 SRR3928583.sra
1.2G Feb 27 11:36 SRR3928584.sra
1.9G Feb 27 11:37 SRR3928585.sra
1.9G Feb 27 11:39 SRR3928586.sra
2.0G Feb 27 11:40 SRR3928587.sra
2.0G Feb 27 11:42 SRR3928588.sra
2.8G Feb 27 11:44 SRR3928589.sra
2.6G Feb 27 11:46 SRR3928590.sra
2.9G Feb 27 11:48 SRR3928591.sra
1.8G Feb 27 11:50 SRR3928592.sra
1.9G Feb 27 11:52 SRR3928593.sra
2.7G Feb 27 11:54 SRR3928594.sra
2.6G Feb 27 11:55 SRR3928595.sra
2.7G Feb 27 11:57 SRR3928596.sra
1.7G Feb 27 11:59 SRR3928597.sra
1.8G Feb 27 12:01 SRR3928598.sra

转换代码如下:

dump='/home/jianmingzeng/biosoft/sratoolkit/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump'
$dump -A  $sample -O $analysis_dir  --gzip --split-3 /home/jianmingzeng/data/public/oscc/sra/$srr.sra

测序数据是有格式的:

@AB911.1 NB501277:61:HTNKHBGXX:1:11101:11520:1071_0_barcode=NA-EE/A-//A//6#-/##/####-AAAC-AACACCN-CNNANNNN length=68
CATCCCCGCCGCGCGTCGCGGCGTGGGAAATGTGGCGTACGGAAGACCCACTCCCCGGCGCCGCTCGT
+AB911.1 NB501277:61:HTNKHBGXX:1:11101:11520:1071_0_barcode=NA-EE/A-//A//6#-/##/####-AAAC-AACACCN-CNNANNNN length=68
A6/AEEAAAEEEAEE/EEEEEEE/EEEE/EEE/EEAEE<AEAAEEEEEEAAEEEE/EAAEEEA6EAAA
@AB911.2 NB501277:61:HTNKHBGXX:1:11101:19199:1073_0_barcode=NA-EEEE-AA/<66#-<##6####-AAAC-CATCACN-GNNANNNN length=68
TTGGGGCATTCACAGAATCTATGGTGGTTTATGGTTGTCCCAACTGACTACAGCCCAGCCCTCTAATA
+AB911.2 NB501277:61:HTNKHBGXX:1:11101:19199:1073_0_barcode=NA-EEEE-AA/<66#-<##6####-AAAC-CATCACN-GNNANNNN length=68
EEEEEEEEEEEEEEAEEEEEEEEEEEEEEEEEEEEEEEEEEAEEEEAEEEEAEAEE/EEEEAEEAEA/
@AB911.3 NB501277:61:HTNKHBGXX:1:11101:21777:1073_0_barcode=NA-EEEA-AAA////-/##/####-AAAC-CATACCT-CNNCNNNN length=68
ATCCTTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATA
+AB911.3 NB501277:61:HTNKHBGXX:1:11101:21777:1073_0_barcode=NA-EEEA-AAA////-/##/####-AAAC-CATACCT-CNNCNNNN length=68
//EEEEEEEEEEEEEEEEEEEE/E</EAEEAE/EEEEEEE/EA<EEE/EEE/AE/AEE/EEEEEE///

所以每条reads都包含有4bp的pool_barcode, 7bp的cell_barcode 以及 8bp的random molecular tag
(RMT)

但是有两个数据,作者忘记把这些信息包含进去了,就是 AB1032.fastq.gz 和 AB1033.fastq.gz 理论上这两个数据是无法处理的。

AB1032.fastq.gz
@AB1032.1 NB501277:76:HWNK2BGXX:1:11101:24314:1080 length=68
CAGATTCTTATTCTAGAGAATAAGAATCTGGATGTGAACTTTATTGTTCATATCCTTGATCTGAGGGT
+AB1032.1 NB501277:76:HWNK2BGXX:1:11101:24314:1080 length=68
/EEAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAEEE/AEEEE/EEEEEEEE6EEAEE<AEAEEEEEE
@AB1032.2 NB501277:76:HWNK2BGXX:1:11101:25906:1080 length=68
GTGCCAGCAGCCGCGGGACTGCCAGCTCCAAGAGCGGAGATTCACGGTGCTGCCGGTACCACGCTCGG
+AB1032.2 NB501277:76:HWNK2BGXX:1:11101:25906:1080 length=68
6EEEE/EEEEEEEE<<//6</EE/EEAA/<E/AEEE/E//A//</E//EE6EE/E//A//6/EEAEE/
AB1033.fastq.gz
@AB1033.1 NB501277:76:HWNK2BGXX:1:11101:21812:1081 length=68
GTAAGCAAAAAAAAAAAAAAAAAAAAAAAAAAAGCCCAGGCCCCGCGGGTCGCCGCGGCGCGCGGGGG
+AB1033.1 NB501277:76:HWNK2BGXX:1:11101:21812:1081 length=68
EEE6EA/AEEEEEEEEEE6EEEE/EE/EE/E///////////EE////<////////////////A//
@AB1033.2 NB501277:76:HWNK2BGXX:1:11101:22107:1082 length=68
TTGGGATCTACGGCCTGGACTTCTATGTGGTGCTGGGTAGGCCAGGGTTCAGCATCGCAGACAAGAAG
+AB1033.2 NB501277:76:HWNK2BGXX:1:11101:22107:1082 length=68
EEAAEEEEEEEEEAEEEEEEEEEAEEEEEE/EEEE/EEAEEEEEAEEEEEEEEEEEE<AEEAAE/EA/

大多数真核生物的体细胞是二倍体,即仅含有两组染色体,分别遗传自父本和母本。而一些特定组织如心脏、肝脏等就含有多倍体细胞,特别是肝脏组织含有较高比例的四、八倍体等多倍体细胞。

肝脏是人体的重要解毒器官,同时酒精、肝炎病毒等毒性物质或毒性代谢物容易诱发肝细胞的基因突变,多倍体被认为有利于提供代偿性的正常基因来维持肝脏稳态。多倍体细胞通常会停滞在细胞周期的间期——G1期,这些细胞很少进行细胞分裂增殖,并最终走向细胞衰老死亡。

然而肝脏受损后,多倍体细胞将会受胁迫进行增殖,再生修复受损的肝组织。这些多倍体细胞分裂将导致三、五、七倍体等非整倍体的产生,也就是丢失匹配的染色体或染色片段,从而造成原癌基因的扩增或抑癌基因的丢失,引起基因组不稳定性和肿瘤的发生发展。因此研究机体调控多倍体细胞产生及多倍体细胞进行细胞分裂的调控机理对于理解肝癌的发病机理和肝癌的治疗至关重要。

(文章转自jimmy的2018年阅读文献笔记)

生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,482评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,377评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,762评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,273评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,289评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,046评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,351评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,988评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,476评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,948评论 2 324
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,064评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,712评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,261评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,264评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,486评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,511评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,802评论 2 345

推荐阅读更多精彩内容