蛋白质三维结构预测、结果解读与评分

蛋白质三维结构预测,只要有目的基因的氨基酸序列就可以做,不限物种,没有太多要求,可为文章增色。
windows版本的VMD软件可在公众号生信星球回复“VMD”获得,且附带软件中文教程。

一、示例序列

以这段序列为例:

AAGGAATTGACAGAAGAGCAGAGAACACAGCTTTTTGAAGATCTAAAACAGTGTAAAAATTCGACAGATCTTTCCGACGATGAGTTTGAAACGATCATTGCTAAGAAGGAGCTCCCTACTTCGGAAGCAGGCAAATGCTTCACGAAATGCTTGATGGAGAAATTGGATATAATTGAGGATGCTGAAGGAGGGAAGAAGAAAATCAGTGTGATCACGATGCAAGCCTCGCTGGAGGAGAATATGGAAAAGGAAGATGATATTGCTAAAGGGAAGGATATCATCCAGAAATGTGGAGATACAGTGGAGCCCGAAGACAGTTGCGCATATGCATATAATATCTCTAAATGCATTTACGATAGAATGAAGGAGGCAGGCATTTCTCAATAA

如果你有核苷酸序列而没有氨基酸序列,可用NovoPro在线工具转换:
http://www.novopro.cn/tools/translate.html


得到的氨基酸序列为:

KELTEEQRTQLFEDLKQCKNSTDLSDDEFETIIAKKELPTSEAGKCFTKCLMEKLDIIEDAEGGKKKISVITMQASLEENMEKEDDIAKGKDIIQKCGDTVEPEDSCAYAYNISKCIYDRMKEAGISQ

二、三维结构预测的方法

主要介绍同源建模与穿线法。

1.同源建模

网站:swiss-model
原理:相似的氨基酸序列对应着相似的蛋白质结构
要求:找到与目标序列一致度≥30%已知结构作为模板

结果页面解读:

(1)首先看搜到的模板与你的序列一致度是否>30%,如果不大于,要发英文文章此结果就应放弃,用iTASSER重新预测。如果只是看看,发中文或放进毕业论文,20%以上也可继续做。



(2)如果可用,再看swissmodel自带的评分高低。
GMQE :可信度范围为 0-1,值越大表明质量越好
QMEAN4:区间-4-0,越接近0,评估待测蛋白与模板蛋白的匹配度越好。



如果swissmodel预测结果不可用或评分不好,用iTASSER重新预测。

2.折叠识别(穿线法)

网站:iTASSER
原理:不相似的氨基酸序列也可以对应着相似的蛋白质结构。
补充说明:已知的蛋白质结构有十几万个,但其所具有的不同的结构拓扑只有1393个,也就是说,所有结构都落在这1393个拓扑内!因此,选择匹配能量最低的拓扑。
要求:没要求,比较任性。一般是不能同源建模(一致度<30%)的蛋白选用这个方法。

注意:必须用学术邮箱注册。

结果页面解读:

https://zhanglab.ccmb.med.umich.edu/I-TASSER/example/
(1)预测的二级结构

(2)预测的残基可溶性(高度暴露的表面残基:9,深埋的内部残基0)

(3)建模使用的模版及多序列比对。不是序列相似性比对,而是用穿线法穿出来。


(4)预测蛋白质功能,以及有可能与之结合的配体和该配体的结合位点


评估:模型质量评估模型质量评估系数C-score:[-5,2],分值越高,可信度越高。

TM-score:两两结构相似度系数,>0.5说明模型具有正确的结构拓扑,可信,<0.17说明模型属于随即模型,不可信。

RMSD:两两结构间的距离偏差。

3.从头计算法

网站:quark

原理:1973年《science》Anfinsen:蛋白质的三维结构决定于自身的氨基酸序列,并且处于最低自由能状态。模拟肽段在三维空间中所有可能的姿态,并计算出自由能最低的一个。

计算量极大,不常用。

预测完成后下载对应的pdb格式文件,用免费软件VMD可读取,就是你预测的三维结构,VMD打开默认就是这么丑的,之后再说如何调整显示。


二.第三方软件对模型评分

模型预测出来后需要有3个评估软件认为合格才能用,下载PDB文件,提交到测评软件。

saves(一次性提供6个软件评估结果)http://servicesn.mbi.ucla.edu/SAVES/,其中有三个显示通过即表示模型可用。

1.verify 3D

超过80%的残基拥有大于0.2的3D/1D值,则模型质量合格,低于0.2的部分需要进一步修正。

2.procheck

拉氏图检查Cα的两面角是否合理,合格的模型超过90%的残基都应该落在红色(允许区域)和正黄色(额外允许区域)落到其他区域的残基应当被查看并修正。

以PDB中高分辨率的晶体结构参数为参考,给出提交模型的一系列立体化学参数(主链)。其输出结果包括:拉氏图,主链的键长与键角,二级结构图,平面侧链与水平面之间的背离程度等。

3.whatcheck

提交的蛋白结构与正常结构之间的差异,指标贼多,绿色多就当通过了。

4.errat

计算0.35nm范围之内,不同的原子类型对之间形成的非键相互作用的数目(侧链)。得分>85较好,晶体可达到95,一般来说结果在91以内。

5.prove

与预先计算好的一系列标准体积的差别,用z-score来表示,显示模版蛋白质与待测蛋白之间的匹配程度,越高越好。
以刚才的同源建模文件为例:


微信公众号生信星球同步更新我的文章,欢迎大家扫码关注!


我们有为生信初学者准备的学习小组,点击查看◀️
想要参加我的线上线下课程,也可加好友咨询🔼
如果需要提问,请先看生信星球答疑公告

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容