一、序
目前对蛋白基因家族进行分析主要有两种方法,一基于同源性,二基于HMM模型。
想要通过HMM模型预测蛋白基因家族,首先得需要HMM模型数据。HMM模型可以从Pfam数据库通过Pfam号下载,那么怎么找到自己要分析的基因家族Pfam号呢?
两种方法:
- 从基因家族分析文献中获取
- 通过蛋白基因名称在pfam中搜索
二、Pfam号查找
一、从基因家族分析文献中获取,就不多说了,文献材料与方法中都会给出。
可根据Pfam号直接在Pfam数据库(http://pfam.xfam.org) 中下载HMM模型。
二、在pfam中通过关键词搜索
首先进入Pfam数据库(http://pfam.xfam.org) ,有两个地方都可以进行关键词搜索(实际上都一样)。
第一个位置
输入关键词搜索
搜索结果
PF开头的编号就是Pfam号
第二个位置
大写的search,不注意还真看不出来。
同样的,通过输入关键词进行搜索结果都是一样的。
三、HMM模型下载
选择自己感兴趣的Pfam号,点击Pfam号进行详细页面。
找到HMM模型下载地址直接下载即可。
至此,得到HMM模型就可以使用HMMsearch软件搜索蛋白基因家族了。
注:图片来自http://pfam.xfam.org网站截图,如有侵权将删除。