群体结构分析软件Structure了解和使用

一、简介

Structure 是一个利用遗传标记推断群体遗传结构的软件。其功能包括推断群体数目,判断某个个体属于哪个群体,鉴别迁移个体及杂合体等。举个例子


上图中颜色的种类即表示群体的数目,也就是说,2种颜色表示该例中的所有样本可以分为2个群体。不同的颜色表示不同的“血统”,或者说,来自于不同的祖先群体。其中每一个黄蓝相间的堆叠图表示一个个体。图中的下标“LF”,“CR”等表示种源地。那么,在本例中,蓝色区域中的个体就可以归为一个群体,而黄色区域内的个体就属于另一个群体,因为这些个体拥有相同的“血统”,尽管它们来自于不同的种源地。
就像亚洲人和欧洲人分属于不同的群体,通俗的讲,我们和欧洲人“血统”不一样。从基因的层面去解释,则是因为我们之间等位基因频率有很大差异,从而反映出表型的巨大差异。并且在近代以前的相当长时期内,几乎不存在任何交流,当然这指的是基因的交流,两个群体各自独立的演化,基因频率间的差异就保持下来,就像例子中黄色和蓝色区域那样,两个群体间差异巨大。而种群内部,比如我们亚洲人,尽管我们中国人和日本人,韩国人,甚至汉族和少数民族之间也存在着基因频率的差异,但是不像和欧洲人的差异那么大。就好比图中蓝色区域内“JD”,“PT”,“JL”等不同种源地间也存在着细微的差异(黄色“血统”所占比例略有变化)。
再看图中“PT"中有一个个体比较特别,它的黄色和蓝色比值接近1:1,那么这个个体很可能是一个外来者,或者是由一个蓝色“血统”和一个黄色“血统”的亲本杂交产生的后代。


二、软件的使用

1.数据格式

Structure 所需要的最基本的数据格式如下:

loc_a loc_b loc_c
George 1 -9 145 66
George 1 -9 -9 64
Paula 1 106 142 68
Paula 1 106 148 64
Matthew 2 110 145 66
Matthew 2 110 148 66
Bob 2 108 142 64
Bob 2 -9 142 -9

表中第一行 loc_a, loc_b, loc_c表示位点或标记, 第一列表示样本,第二列表示种源地或亚群,若没有这类信息则全部以1代替。对于二倍体来说,每个样本的基因型由相邻的两行表示,每列为一个locus,每行为其中一个allele。
这里只做了简单的介绍,详细信息参考软件使用手册:Structure documentation

2. 参数选择

将整理好的基因型数据导入Structure,设置参数“Number of MCMC Reps”, “burn-in period”, “length of burn-in period”。
由于该软件所采用的算法是一个随机过程,因此,对于每一个K,需要进行多次重复运算以保证结果的可靠性。

3. 判断最佳K值

将结果打包,提交给在线软件Structure harvester,分析最佳的K值。

4. CLUMPP

使用CLUMPP对structure分析的重复运算结果进行重复抽样分析。得到最佳K值的Q-matrix结果。

5. 作图

将CLUMPP的结果传递给distruct,进行structure图形的绘制。

三、大杀器

重点来了,由于以上步骤过于繁琐,且经常要进行此类分析,本着一切繁琐的,或重复的劳动都应该自动化的原则,我对以上软件进行了深度封装,只需提供structure格式的文件及配置文件即可一键搞定,不需要人为干预,包括K值的选择,软件会自动完成。

1.查看帮助信息


目前只完成了formatting数据格式转换和structure两个模块。

2.数据格式转换

该模块将我们的SSR分析结果转换成多种其他软件需要的数据格式。


只需要提供config 文件


运行程序

2. 运行Structure


将直接得到structure harvester的结果和最终的structure结果:

meanLnPlot.png
deltaK.png
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容