参考教材:《生物信息学》(第二版) 樊龙江 主编
蛋白质功能域
一条蛋白质序列中的一段保守区域,该区域能够独立行使功能、进化等。
在蛋白质结构中,是一个蛋白质结构的一部分,能形成一个紧密的三级结构,能独立折叠且结构稳定,同样具有独立功能和进化等特征。
功能域模型
目的:除了多序列联配的结果,用更好的方式描述功能域并应用。
一致序列consensus sequence
多序列联配结果中每一列出现最多的碱基或氨基酸构成的序列,是一条单一序列。
正则表达式regular expression
把每一列出现的碱基或氨基酸都列出而形成的。
概型profile
是一个类似PSSM的矩阵,但它可以包含匹配、错配、插入和缺失等情况。提供了多序列联配中每一列出现各种氨基酸(或空格)的概率(经过对数转换并取整数)。
HMM概型(隐马尔可夫模型)
用参数表示的用于描述随机过程统计特性的概率模型,是一个双重随机过程,由两部分组成:马尔可夫链和一般随机过程。
详情见书P381
熵与不确定性
信息量IC=2-H(H越大,IC越低)