基本功能
为了产生不同类型的网络,DisGeNET的控制面板提供了可以调整的参数。包含三个标签:gene disease network, disease projects, gene projections.默认的是gene disease network,这种模式下,不同的GDA(gene disease assosiations)网络可以通过选择不同的data来产生。Assosiation类型和/或disease classes由下拉菜单产生。GDA网络可以通过cut-off过滤。另外,GDA网络可以围绕一个特殊的疾病或基因建立,需要通过search boxes。其中一些功能也可以用来产生疾病project和gene project网络。
1.产生疾病相关网络
如果想获得特定某一来源的GDA网络,例如curated data,这是来自于很多网络的经过专家逐一认可的(uniprot,ctd-human,clinvar,orphanet,GWAS Catalog),选择感兴趣的来源即可,然后点create network。
GDA网络包含16969nodes,55641edges。可以应用cytoscape的layout算法来产生你想要的方式,例如选择organic。应用disgenet style。一旦获取了网络,一旦获取了网络,关于nodes和关系的特别信息就可以获得,面板右下角。例如使用cytoscape搜索框发现disgenet不同的疾病,包含alzheimer,如下图
2.产生gene或疾病projection 网络
如果想获得疾病网络来自于GWAS Catalog的,那么选择desease projection标签。然后选择source为GWASCAT(有下拉菜单)然后摁下create network。这个网络包含231个疾病,2844个edge。见下图
3.把网络先知道某一个特定的相关类型
建立GDA curated网络,限制类型为causal nutation,那么选择source为curated,从association 类型下拉菜单选择causal mutation。摁下create network,那么GDA网络会获取包含7625个nodes和8289个edges。见下图
这里,作者提出了一个小问题思考
nodes and 8299 edges. Could you find the gene in network carrying causal mutations for the largest number of diseases? Hint:order genes by column nrAssociatedDiseases?
找出哪个突变在最多类疾病中出现?
同理,我也做了一个各种疾病标记物的网络,也看了下哪种标记物出现在最多的疾病中,和哪种疾病的标记物最多
可见,TNF出现在最多的疾病标记物,特异性应该很低了
4.限制网络到某一具体的疾病class
网络也可以通过疾病类型进行过滤。疾病类型基于desease分支(C),和三个categories(F01,F02,F03),这都是基于Psychiatry和Psychology Branch(F),MeSH的等级分类。为了产生来自predicted数据的网络,并且假如我们只想包含Nutritional and metabolic disease。那么选择source(predicted),选择disease class(Nutirtional and metabolic disease)这在disease class下拉菜单实现。然后,create network。这个GDA网络有1237个nodes和1676个edges。考虑下,哪个疾病有最大数目的基因?
5 建立某一个基因/疾病或疾病/基因的set
控制面板中的search功能可以用于
围绕一个疾病或基因产生网络
围绕一个疾病和基因产生网络
围绕一组疾病或基因产生网络,匹配关键词
搜索可以限制source,关系类型,疾病类型,得分
还是可以不限制条件生成所有网络,然后在控制面板的搜索框输入比如“Alzheimer”
或者最好是直接上面条件不限制,在搜索框输入“Alzheimer”这样更快
网络可以通过增加条件进一步过滤,比如输入APP,在gene search box,摁下create network。那么alzheimer所有亚型相关的网络和APP有关的就产生了。每个边代表gene-疾病直接关系的证据,这个关系是被source定义的。一个联系类型,或一片文章。每一个边的颜色区分联系类型。使用edge table在右下角的table panel可以探索每个联系的证据。