#分子模拟 #Rosetta从头结构预测

Rosetta从头结构预测

此文档不完全翻译自官方从头预测文档
当蛋白与已知解析蛋白结构为低相似性的时候从头预测变得非常有用。在从头预测算法中,蛋白序列在 n-mer 片段文库中进行phi/psi角采样来进行构象的扩展(extended conformation)和“折叠”。当整个蛋白质氨基酸残基数小于100以内时,其结果较为精确。

官方有Rosetta@home计划的在线服务器,可以直接提交序列,然后在线服务器进行计算,但每个帐号只能计算一条序列,且要注意的是不能进行已知序列或者高相似度序列的计算,否则会ban ip,删号。因为从头结构预测时间太久太长。
官方地址如下:http://robetta.bakerlab.org/
网站截图如下:

网站截图

该项目是伯克利分校搞的一个分布式系统项目BOINC,若你也想加入这个计算可以具体查看这一篇教程
想与各位探讨的是个人觉得若单独拿一段序列进行从头计算然后拼接进模型中是不准确的,更好的方法是进行loop环的补全(若缺失部分为loop环),或者进行分子动力学模拟来预测。
官方的从头预测方法是采用的T4 溶菌酶(噬菌体中)的序列来进行的蛋白结构预测。并于解析了结构的蛋白PDB文件进行比较。
图文无关,纯粹好看

1.准备输入文件

需要:

  • fasta格式的序列
  • 9mer 片段文件
  • 3mer 片段文件
  • 已知的pdb文件

1.保存蛋白序列文件为FASTA格式
例如:

>2LZMA                                                           
 ITKDEAEKLFNQDVDAAVRGILRNAKLKPVYDSLDAVRRCALINMVFQMGETGVAGFTNSLRMLQQKRWDEAAVNLAKSRWYNQTPNRAKRVITTFRTGTWDAYKNL    

2.准备片段文件。这些片段文件包含短的骨架碎片,在模拟期间其将会随机插入在所有位置。教程中提供了一些片段文件:

input_files/aa2LZMA03_05.200_v1_3 (3mer fragments)
input_files/aa2LZMA09_05.200_v1_3 (9mer fragments)

这个片段文件生成较为复杂,需要用perl脚本和库文件,安装许多包才能实现,我也还没有完全搞透,由于时间关系,搞透以后作为补充分享给大家。并且搞透的意义不大,毕竟也不是做这个的。
建议大家还是用上面的网站的Fragment Libraries进行在线制作。

3.为了与已知文件进行比较分析结果准确度,所以插入已知文件,当然这个不是必须的。

input_files/2LZMA.pdb 

由于option文件设置较多,我们分开来讲解。
首先是输入文件设置

-in
    -file
        -native input_files/2LZMA.pdb
        -fasta input_files/2LZMA.fasta
        -frag3 input_files/aa2LZMA03_05.200_v1_3
        -frag9 input_files/aa2LZMA09_05.200_v1_3

这个没有什么好说的,接下来是建模设置

-abinitio
    -relax
    -increase_cycles 10 
    -rg_reweight 0.5    
    -rsd_wt_helix 0.5   
    -rsd_wt_loop 0.5    

increase_cycles表示AbinitioRelax 循环的次数,若想快速完成可以设置为0.1,后面三个参数分别为回转半径,螺旋和环赋予的权重,没有深入了解一般默认即可
然后是relax设置,若想快速完成该步可以不设置

-relax
    -fast

-fast设置表示在建模后对蛋白进行一个FastRelax,其同时兼容了准确性和速度。
最后是输出

-out
    -pdb
    -nstruct 1  
    -file
        -scorefile score.sc
-overwrite  

-nstruct 1

官方教程设置了两次-nstruct,原因待考。

2.运行Rosetta AbinitioRelax 应用

$> ../../../main/source/bin/AbinitioRelax.default.linuxclangrelease @input_files/options

当然也可以在后台运行:

$ nohup ../../../main/source/bin/ AbinitioRelax.default.linuxclangrelease @input_files/options > log &

每个结构约运行10-20分钟

没有错误的话将会输出如下结果:

  • S_00000001.pdb (生成的模型)
  • score.sc (展示得分,Rosetta的得分算法将会在后期介绍)

为了得到精确的结果,建议生成50,000到100,000个模型(官方教程中一说至少1,000)

3.分析结果

3.1 绘制得分图和rmsd图

你可以绘制得分最好的5%或10%的模型图。total_score和rms数据都在score文件中提供。你可以使用同源蛋白做参考(毕竟有pdb数据的话就不用从头建模了)如果连同源结构都没有的话一般考虑最低能量模型。
可以用awk简单的提取数据

$ sort -n -k2 score.sc | head -n 5000 | awk '{print $25 "\t" $2}' > score_rmsd.dat

然后可以对数据进行绘图,绘图的方法多种,也非常简单,后期会完整介绍。

左图可以发现rmsd与score成相关性并且收敛,而右侧没有收敛,说明右侧的结果并不那么可靠

3.2 提取模型

获得的结果中有一个二进制silent file(此要在设置中设置,这样生成的模型都压缩在一个文件中,可以节省空间更加美观,其实也可以不对其进行这个操作,详见Rosetta silent file一章)我们可以从中提取pdb文件,例如我们想提取得分最好的5个文件。

$ sort -n -k2 score.sc | head -l 5 

将会获得模型的名称,将silent file对这些模型名称进行提取即可。

$  ../../../main/source/bin/extract_pdbs.default.linuxgccrelease -in:file:silent_struct_type binary -in:file:silent AbRelax.out -in:file:tags <e.g. S_0013 S_0780_1 ...>

好的Rosetta得分并不代表结构就一定是好的,所以我们在进行任何分子模拟的时候一定要有许多辅助的实验验证,这样的结果才可是可靠的可信的。我们需要不断的提醒自己。结果可信吗!

更多原创精彩内容敬请关注生信杂谈

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容