基因家族是最近比较火的一个研究话题,被称为打开生物学问题百宝箱的钥匙,接下里几周抽时间和大家简单分享一些我最近学到的东西。
基本概念介绍
基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物, 同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。
按功能划分:把一些功能类似的基因聚类,形成一个家族,例如GH家族(糖苷水解酶家族)等。
按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族,一般使用orthoMCL进行聚类
motif是蛋白质分子具有特定功能的或者作为一个独立结构域一部分相近的二级结构聚合体
常见的基因家族例子(以植物的为例)
NBS-LRR抗病基因家族: NBS-LRR(nucleotide-binding site and leucine-rich-repeat)是植物中最大类抗病基因家族之一。
MADS-box基因家族是植物体内的重要转录因子,它们广泛地调控着植物生长、发育和生殖等过程。在植物中参与花器官的发育,开花时间的调节,在果实、根、茎、叶的发育中都起着重要的作用。
热激蛋白70家族(HSP70)是一类在植物中高度保守的分子伴侣蛋白,在细胞中协助蛋白质正确折叠。
钙依赖蛋白激酶(CDPK)是一类仅依赖Ca2+而不依赖钙调素的蛋白激酶,参与调控多种信号转导途径,而膜结合脂肪酸脱氢酶(membrane-bound FAD)是一类不饱和脂肪酸合成途径的关键酶。
这两类基因分别在低温环境胁迫下的信号转导和稳定质膜性质中起着非常重要的作用。
WRKY基因家族是植物前十大蛋白质家族之一,大量研究表明, WRKY 基因家族的许多成员参与调控植物的生长发育、形态建成与抗病虫等。
常规的基因家族分析流程
在这些常规的生信分析后,一般的文章还会加上一些湿实验去验证,例如不同非生物条件下基因家族的表达等(PCR为主)。
最近发表的基因家族文献
如果你想研究基因家族,阅读别人的文献,从中体会其研究的思路与方法是必不可少的,下面给大家推荐一些近期发表的文章。
auxin response factor gene family
这周主要是热一热身,后面会按照每个生信分析的点,结合实例详细给大家介绍如何进行基因家族的生物信息分析。敬请期待!
参考链接:https://www.zhihu.com/question/59831019/answer/180395918
继续和大家分享在推特上看到的有趣的内容:
很多人都没有意识到安装生信工具并没有那么简单,并且就算你安装好了该工具,你用该工具运行你自己的数据远远没有想象那么简单。就像下图提到的,作为一个生信工作者,你是否也遇到这一系列头痛的经历?
欢迎大家在评论区留言,分享一些你在生信中所遇到的头痛经历。