HPA数据库(Human Protein Atlas)是基于蛋白组学,转录组学以及系统生物学数据,可以绘制组织、细胞、器官等图谱。不仅收录了肿瘤组织,也涵盖了正常组织的蛋白表达情况,而且还可以查阅肿瘤患者的生存曲线。
接下来,我们进一步了解该数据库的细节。
网址:https://www.proteinatlas.org
整个界面还是比较清爽的,SEARCH栏中我们可以搜索想要查的基因或蛋白信息。
在Fields可以进一步限定检索范围,包括GENE INFO,DATA RELIABLITY,ANTIBODY VALIDATION,PRIMARY DATA,PROTEIN ENVIDENCE,EXTRA。
接下来,我们以CDK1为例,有对该基因的描述,以及证据等级,以及各种图谱结果(tissue, Cell type, Pathology, Brain, Cell)。我们发现每个图谱都有圆形标示,圆形表明证据级别最高(enhanced),其次3/4(supported),1/2(approved),1/4(uncertain)。
我们以CDK1为例,点击CDK1,则显示其蛋白信息,基因名称,组织特异性,细胞特异性,血液特异性,脑组织中特异性,在肿瘤中诊断价值,预测位置,亚细胞概要以及蛋白功能,分子功能,生物学过程,相关级别,ligand,以及基因概要。
继续下拉到底部,主要包括六种图谱,分别是Tissue atlas,Single cell type atlas, Pathology atlas, Brain atlas, Blood atlas, Cell atlas。
TISSUE ATLAS:涵盖了一般信息(基因名称,描述,蛋白分类,预测位置,转录本数目),蛋白图谱信息(RNA表达组织特异性,RNA表达组织分布,蛋白证据等级,蛋白表达定位),免疫组化数据可靠性(数据可靠性,评分,相应抗体)。RNA和蛋白表达图谱,按照人体器官分布,左侧显示的是RNA表达,右侧是蛋白的表达。
在Tissue atlas中,蛋白表达概要中显示在不同器官中表达水平,想查阅哪部位则点击相应部位,如我们查看CDK1蛋白在肺中表达情况,我们则需点击Lung那条柱。
而查阅RNA表达水平,HPA提供了三个转录组学数据,分别是HPA,GTEx,和Consensus。
CELL type Atlas:跟Tissue Atlas前面类似,存在general information, Human protein atlas information, single cell types以及single cell tissue。另外也可以查阅在细胞系中表达情况。
Pathology Atlas:前面类似,包含general information, Human protein atlas information,增加了免疫组化信息,如数据可靠性,证据等级及相关抗体。在Pathology Atlas,可以看到该项目在不同肿瘤预后概要,通过颜色区分,粉红色为高表达,蓝色为低表达,两组预后生存率是否存在差异。另外也关联了该基因在TCGA数据库中信息,在不同肿瘤中RNA表达情况。
在不同肿瘤中蛋白表达情况(免疫组化结果),以及采用不同抗体表达情况。我们点击Protein Expression中某一个cancer,我们可以查阅到该疾病患者生存情况以及疾病分期。每个图谱都有相应注释,包含Dead,Alive,Density dead,Densityalive,Density deadunder cut off, Density dead over cut off。继续下拉,我们可以查看到具体某一病例免疫组化结果。
我们可以用同样方法,去查询在brain 和blood atlas。Brain Atlas包含了在human和mouse两个物种的图谱。相应数据来源有四个数据库,分别为HPA,GTEx, Consensus和Fantom5。在Blood Atlas,数据来源于HPA,,Consensus,Monaco,Schmiedel。
我们可以通过HPA去查询我们想要的数据。去寻找在肿瘤组织以及正常组织中差异表达。