完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:
plink安装及基础用法 - 简书 (jianshu.com)
统计主要包括标记水平和个体水平两部分:
- 标记水平:缺失率、杂合率、等位基因频率;
- 个体水平:缺失率、杂合率。
输入
$ ./plink --allow-extra-chr --freq --hardy --missing --het --vcf genotype.vcf
--allow-extra-chr:允许额外染色体编号
--freq:最小等位基因频率
--hardy:标记杂合度
--missing :标记与个体水平缺失率
--het :个体纯合基因型数目
--vcf :指定 VCF 文件为.vcf,也可以是压缩格式.vcf.gz
输出
plink.frq:标记最小等位基因频率 MAF
plink.hwe:标记杂合度 O(HET)
plink.lmiss: 标记缺失率 F_MISS
plink.imiss:个体缺失率 F_MISS
plink.het:个体纯合度 O(HOM) / N(NM)
引用转载请注明出处,如有错误敬请指出。