1. 基于变异有害性的筛选
base on the sample.vari.hg19_multi
1)突变位点筛选
FREQ(1000G_ALL) < 0.01
keep: exonic and splicing(up and down 10bp)
remove: synonymous
-
keep: deleterious (SIFT,Polyphen, MutationTaster,CADD more than 2 )
2)突变位点有害性分类
base on ACMG
3)结构变异CNV有害性分析 (不能做)
基于DGV数据库(MacDonald, J.R., et al. , 2014)和CNVD数据库(Qiu, F et al. ,2012)的记录
DGV数据库中收录的是健康人群中基因组大于 50bp、小于 3Mb 的结构变异
CNVD 数据库( Qiu, F et al. ,2012)中包含和人类疾病相关的 212,277 条 CNV 数据
2. 基于样本情况的筛选
1)显隐性遗传模式
1.1 显性遗传模式
如果爸妈是正常人,选择爸妈没有,孩子有的突变。。 0/1
如果妈妈正常,爸爸和孩子生病,选择爸爸和孩子都是杂合的位点
首先考虑杂合突变
1.2 隐性遗传模式
隐性遗传致病包括两种情况,基因纯合变异以及复合杂
合变异。
纯合变异筛选:
患者为纯合子(1/1),正常人为杂合(0/1)或未突变(./.)
复合杂合变异筛选:
- 先挑出患者和正常人的杂合位点(0/1)
- 一个基因在患者中至少有两个杂合突变位点,且这两个位点不与任何正常人的突变位点一致,或是他的子集
2)新生突变筛选(复杂疾病)
变异:
基于samtools de novo方法的筛选
基于call出变异的结果,筛选父母没有而子女有的变异
两种办法的交集
》》》筛选之后做过滤 (1000G, Function,Synonymous,Deleterious)
》》》 新生突变速率
》》》 新生突变注释
CNV:
2)连锁分析 (不太懂)
LOD
3) 纯合子区域分析(ROH)
4) 共有突变基因筛选(散发样本)
过滤有害性位点基础上,选取10%的患者中共有的(如果有case control, 需满足90%的 control样本不携带此基因的有害性突变)
3. 基于基因功能与表型的筛选
1)候选基因富集分析
GO功能富集
KEGG通路富集
2)基因-疾病表型关联性分析
2.1 关联网络图
基因与疾病的关联
2.2 候选基因疾病相关性排序
3)(复杂疾病)蛋白网络互作分析(PPI) GeneMANIA
药物基因组学
基于PharmGKB和Drugbank数据库
个性化分析:
复杂疾病:
1. 基于位点/基因的关联分析
1.1 基于位点的关联分析
1.2 基于基因的关联分析(burden analysis)
基于CRAN SKAT BURDEN检验
肿瘤异质性
肿瘤异质性,表现为肿瘤组织间 / 肿瘤细胞间在基因组突变信息及生长速度、侵袭能力、药物敏感性等方面的差异。
多位点取样探索肿瘤异质性的研究集锦