基因流分析——Treemix

基本概念:

基因流(也称基因迁移)

是指从一个物种的一个种群向另一个种群引入新的遗传物质,从而改变群体“基因库”的组成。通过基因交流向群体中引入新的等位基因,是遗传变异一个非常重要的来源,影响群体遗传多样性,产生新的性状组合。

其他细节移步之前的文章基因流分析——D统计

Treemix介绍

treemix由Joseph K. Pickrell和Jonathan K. Pritchard开发,文章Inference of population splits and mixtures from genome-wide allele frequency data. 通过从多个种群中获得等位基因频率,返回该种群的最大似然树,并推断可能发生的杂交事件。
Treemix软件使用全基因组的等位基因频率数据,推断多个群体的分化和混合的模式。该软件输入数据为多个群体的等位基因频率数据,可以生成这些群体的最大似然树,并且可以推测群体混合事件。软件的示例数据是53个人类基因组数据,得到如下结果:

FigureA. Maximum likelihood human tree

人种最大似然树。群体的颜色代表其地理位置。下方的比例尺展示了样品协方差矩阵中元素的10倍平均标准差。


FigureB. Residual fit from tree

残差拟合热图。通过图A的最大似然树得到的残差拟合值。将每对群体(群体i和群体j)之间的残差协方差值除以所有样品对之间的平均标准差,使用这个标准化后的残差绘制该图。右侧为颜色标尺。白色(0点)以上的残差表示对应群体之间的关系比最大似然树上的关系更紧密,暗示这些群体之间有基因渗入事件。


FigureC. ML tree of 53 human populations with inferred migration edges

在最大释然树上展示渗入事件(箭头)。

Treemix基本原理

1、使用基因频率数据可以计算出每对群体之间的协方差,这是实际的协方差(Real value);
2、使用基因型频率数据可以构建最大似然树,利用两个种群在树上的关系,可以计算出协方差的估计值(Estimated value);
3、通过实际值与估计值之间的差,判断两个种群之间是否发生基因流。即如果实际值小于估计值,说明我们构建出来的树,夸大了种群之间的差异,提示种群之间有基因交流,因为基因流会减少种群之间的差异。

软件下载:

依赖软件:

  1. 最新版Boost
  2. 最新版gsl
    下载
wget -c http://ftp.club.cc.cmu.edu/pub/gnu/gsl/gsl-latest.tar.gz

安装

tar -zxf gsl-latest.tar.gz
cd gsl-2.x
./configure
make
make install
#添加环境变量
export PATH=$PATH:/usr/local/bin
export C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/include
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
export GSL_LD=/usr/local/lib

下载Treemix

下载地址:Treemix
安装

tar -zxvf treemix-1.13.tar.gz 
cd treemix-1.13/
#默认安装需要root权限
./configure 
make
sudo make install

下载需要用到格式转换脚本:

conversion script
plink2treemix.py
把这些脚本都放到环境变量即可。

Treemix的使用

Treemix有官方的说明书,写得非常详细,下面我只列举一些我用到的参数。

输入文件

1、存储每个个体基因型的vcf文件(YourFileName.vcf);
2、样品分组文件(第一列和第二列都为样本名称,第三列为分类单元名称,population.txt);
3、分组的排序文件(poporder.txt)。
前两个文件是构建进化树所必须的。第三个文件规定了热图中的分组顺序。

运算

导入vcf文件
File=YourFileName.vcf
#导入clust文件
clust=population.txt
#LD过滤
plink --vcf $File --indep-pairwise 100 20 0.2 -out ${File%%.*}_LD100_20_02 --make-bed
plink --bfile ${File%%.*}_LD100_20_02 --extract ${File%%.*}_LD100_20_02.prune.in --out ${File%%.*}_LD100_20_02_vcf --recode vcf-iid
#使用文件格式转换脚本生成treemix输入文件
gzip ${File%%.*}_LD100_20_02_vcf.vcf
vcf2treemix.sh ${File%%.*}_LD100_20_02_vcf.vcf.gz $clust
#运行treemix
for i in {0..15}
do
        treemix -i ${File%%.*}_LD100_20_02_vcf.treemix.frq.gz -m $i -o ${File%%.*}_LD100_20_02_vcf.$i -root 1 -bootstrap -k 200 > treemix_${i}_log &
done

参数解释:

-root 指定外群(outgroup)
-k 以滑动窗口的方式选择SNP位点构建树
-m 指定预估可能有几次基因流事件。比如根据经验推测可能有两次基因流事件,则-m参数设置为2({0..15}执行-m等于0-15)
-g 指定先验进化树
-bootstrap 进行bootstrap replicate
-noss 关闭样本数量矫正

数据可视化

#R环境
source("plotting_funcs.R")
poporder="poporder.txt"
#绘制-m等于11的结果
outstem="YourFileName_100_20_02_vcf.11"
#绘制FigureC
plot_tree(outstem)
#绘制FigureB(残差图)
plot_resid(outstem,poporder)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容