基因家族的概念
基因家族 : 来源于同一个祖先,由一个基因通过基因复制而产生的两个或多个拷贝而构成的一组基因,他们在结构和功能上面具有明显的相似性,编码相似的蛋白质产物。
包括直系同源和旁系同源
基因家族的起源——复制
A:全基因组复制:全基因组复制造成的重复区通常是一大片区域中所有基因的重复,而不是单个基因或几个基因的重复。高等植物,很多都经历过多倍化过程,那么基因组在多倍化的过程中,就会发生基因的成倍增加
B:串联重复复制:串联复制主要发生在染色体重组区域,串联复制形成的基因家族成员通常紧密排列在同一条染色体上,形成一个序列相似、功能相近的基因簇。
C:转座子介导的复制:由转座子介导的复制
D:散在复制:导致复制的基因距离较远,甚至位于不同的染色体
E:逆转录复制:指已经转录和剪切的mRNA,再经过逆转录过程形成cDNA,然后随机插入到染色体的某一位置形成新的重复基因的过程。
基因复制的命运
丢失
积累突变,最终失去功能,形成假基因
保留
分化,突变积累
亚功能化
产生新功能
趋同,单个基因成员共享相同或几乎相似的序列。基因家族维持高度同质性的过程
(致同进化)
基因家族的层级
超家族
家族
亚家族
为什么要做基因家族
1.基因家族的基因在物种之间都是比较保守的,通过基因家族分析可以得到某物种特有的家族基因,而这些基因则有可能与该物种的特异性有关。
2.通过对多物种构建系统发育树,从而得到物种起源进化或亲缘关系方面的信息,并为后续遗传操作提供参考。
3.基于单拷贝基因家族,可估算出物种间的分歧时间。
4.可以挖掘某物种中哪些基因发生了明显的扩增/收缩,这些变化可能与该物种某些强/弱化的生物学分子功能有关。
5.通过分析家族基因在进化过程受到的正向选择,确定与该物种环境适应性相关的基因。
怎么做基因家族
1.搜索基因家族成员蛋白保守结构域,鉴定基因家族成员
2. 构建系统发育树
3.基因家族成员在染色体上的分布(circos图,核型图)
4.基因结构分析
5.基因家族成员Motif分析及绘图
6. 表达分析(不同组织和生长阶段,生物与非生物胁迫,实验设计qRT-PCR)
7.进化分析(多个物种进化树构建,物种间的共线性分析)
8.结合转录组数据分析该基因家族成员的表达