全基因组关联分析 GWAS (Genome-wide association study)
应用基因组中数以百万计的单核苷酸多态;SNP为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略
1、关联分析模型
一般线性模型(GeneralLinear Model):y = Xα + Zβ + e
混合线性模型(Mixed Linear Model):y = Xα+ Zβ + Wμ+ e
y:所要研究的表型性状;
Xα:固定效应(FixedEffect),影响y的其他因素,包括群体结构、性别、年龄等因素;
Zβ:标记效应(MarkerEffect);
Wμ:随机效应(RandomEffect),这里一般指个体的亲缘关系。
2、关联分析统计方法
Bayes:Bayes A、Bayes B、Bayes C、Bayes Cpi
统计软件:GenSel、GenABEL,均为R程序包。
CMLM (Compressed Linear Mixed Model)
统计软件:GAPIT、TASSEL
EMMAX (Efficient Mixed Model Association)
统计软件:emmax
GBLUP(Genomic Best Linear Unbiased Prediction):专门用于Genomic prediction
统计软件:ASReml
3.数量性状
指个体间表现的差异只能用数量来区别,变异呈连续性的性状。它具有两个主要特征:变异呈连续性,变异易受环境条件影响。其主要特征有:①个体间差异很难描述,需要度量;②在一个群体中,变异呈连续性;③数量性状常受多基因控制;④数量性状对环境影响敏感
4.质量性状(discrete characters )
指属性性状,即能观察而不能量测的性状,是指同一种性状的不同表现型之间不存在连续性的数量变化,而呈现质的中断性变化的那些性状。按所属学科不同有三项不同定义。在单基因遗传病中,基因型和表现型之间的对应关系较为明显,因此这一性状的变异在群体中的分布往往是不连续的,可以明显地分为2~3群,所以单基因遗传的性状也称质量性状。
5.Hardy-Weinberg equilibrium (HWE)
在理想状态下,各等位基因的基因频率以及基因型频率在遗传中是稳定不变的,即保持着基因平衡。
HWE有助于确定有明显基因分型错误的SNPs,因此要求位点SNP的等位基因频率符合哈代-温伯格平衡。