蛋白受体选择
UniProt数据库: https://www.uniprot.org/
这里以CEACAM6为例
优先选择实验解析的蛋白结构,且分辨率较低结构缺失较少的蛋白结构。这里确定IDENTIFIER为4Y8A,共A/B两条链
PDB数据库: https://www1.rcsb.org/
下载蛋白结构到工作文件夹,注意分子对接工作文件路径不能存在中文
总结:需要根据一些文献知识,了解一般配体所在的部位即相关活性位点。有没有已知的结合区域来参考选择,我个人认为,如果没有已知的结合区域来参考选择,链越长的越好,后期还可以进行可药性口袋预测。有的还是多条肽链的复合物,如果是二聚体的,后面对接可以删除一个。总之,需要先了解这些所解析的晶体结构是否已经包含了拟对接分子的潜在结合位点,已知的配体和我们要对接的分子结构相似度。越相似越好,还需注意晶体结构中蛋白序列是否为野生型、是否含有PTM、是否存在有可能引起构象变化的特殊有机溶剂和别构效应分子等。如果系列晶体结构的性质都类似,选择分辨率最高的。
配体分子文件格式转换
PubChem数据库:https://pubchem.ncbi.nlm.nih.gov/
以姜黄素为例,下载3D结构sdf文件
Open Babel软件将sdf格式转换成PDB格式
蛋白受体文件的预处理
pyMOL软件预处理
设置工作文件夹
导入蛋白,或者直接fetch 4Y8A命令
切换到链选择模式,输入命令remove chain B
返回残基选择模式
显示蛋白序列
以氨基酸名称显示
删除水分子,输入命令remove solvent,或把链为0的删掉
删除金属离子及其他溶剂分子或配体
导出蛋白4Y8A_PYMOL.pdb文件
修复蛋白结构
SWIFT数据库:https://swift.cmbi.umcn.nl/servers/html/model.html
保存蛋白prepdock.pdb文件
AutoDockTools软件预处理
设置工作文件夹
导入蛋白prepdock.pdb文件
这里,颜色显示方式,我们可以点击CL栏的下三角符号,可以通过不同方法按照颜色选择。比如下面的,通过原子类型。
设置蛋白展示风格
关于什么颜色代表什么原子,如下:
加氢:在选择一个分子作为配体或受体之前,必须把所有的氢都加到这个分子上
保存受体文件,上面这一步操作方式选择大分子会自动执行以下一系列初始化步骤,ADT检查分子是否带有电荷。如果没有,它会给每个原子加上Gasteiger电荷。记住,所有的氢必须先加到大分子上,然后才被选中。如果分子已经带电荷,ADT会问你是否想保留输入电荷而不是增加Gasteiger电荷。还有,该步骤,ADT会合并非极性氢,如果你不需要,需要手动设置。
口袋预测
PROTEIN PLUS数据库:https://proteins.plus/
上传蛋白prepare.pdb文件
下载结果筛选可药性打分最高的口袋命名为pocket.pdb文件
Open Babel软件将pocket.pdb文件转换为pocket.pdbqt文件
设置工作文件夹
导入口袋文件pocket.pdbqt
设置显示风格
x,y,z先设置为10左右,盒子调整显示为线条
保存好设置好的盒子参数
配体小分子的预处理
AutoDockTools软件预处理
设置工作文件夹
导入小分子Curcumin.pdb文件
在选择一个分子作为配体或受体之前,必须把所有的氢都加到这个分子上。
这里打开小分子文件后,加氢这一步弹出的窗口默认就行,如果读入的mol2格式的文件,那么在方法处选择的是withBondOrder ,默认也是withBondOrder。
将分子选择为配体
检测中心
检测扭转键
导出Curcumin.pdbqt文件
特殊情况
有时候,我们不手动添加电荷,按照上面的操作,有的小分子也会报错,那就是每个电荷都为零的情况,我们在选择作为配体之前需要计算Gasteiger电荷,具体怎么计算看下图,按照下图操作后在设置为配体
AutoDock对接操作与对接结果解读
把下面两个软件复制到工作文件夹
设置工作文件夹
导入prepdock.pdqpt文件
导入Curcumin.pdbqt文件
调整显示风格
设置口袋盒子参数
当小分子在盒子中时通过将上图√去掉,右键选择小分子进行拖动出来,操作好后√选回去保持原设置
保存盒子
导出GPF文件4Y8A.gpf
接下来运行Grid
选择我们前面保存的4Y8A.gpf文件,选择后log Filename这一栏就会自动填写,这里需要注意的是,工作目录需要和我们前面设置的一样
点击launch后会弹出窗口,不要关闭这个窗口,因为程序一直在运行,这个过程你在工作目录下生成一些map格式的文件
接下来,准备AutoDock的运行参数以及计算方法。这里选择的是半柔性对接,选择Set Rigid Filename。
选择prepdock.pdbqt文件
设置搜索参数和算法,在最后一个弹出框中,第一个选项,Number of GA Runs表示我们对接多少次,这里默认0次,官方建议对接50次以上。还有,Maximum Number of evals 和Maximum Number of generations 的值可以设置大一些,从而获得较优构象,但值越大,后面运行AutoDock的时间会越长。
设置对接参数
导出DPF文件4Y8A.dpf
接下来运行AutoDock
在对接完成之后需要分析分子对接结果,我们先用文本文档软件打开我们的dlg文件。文件头部是使用的软件版本等信息,然后是程序运行的一些参数记录。
FINAL GENETIC ALGORITHM DOCKED STATE往下是我们的对接结果,如果不是用GENETIC ALGORITHM DOCKED,该出名称不一样,结果中,Run = 1是第一次对接的结果。我们重点看Estimated Free Energy of Binding这个参数,但这里的Run = 1不代表结合能最低,只是运行的一个顺序,一次对接有50个结果。
我们一直往下拉,在CLUSTERING HISTOGRAM处会看见一个表。这里把50个运行结果统计在这里表示,我们可以清楚的看到,第12次的运行结果的结合能才是最低的。
接下来我们用ADT分析对接结果,先把当前窗口的所有分子删除。
通过Analyze-Dockings-Open来打开分子对接的输出文件4Y8A.dlg
我们可以看到,当前结果的结合能是-0.52,在对接位置处产生了1个氢键,位置是第1个氨基酸处。
我们可以加载所有的信息出来,和前面文本文件打开的信息一样
我们切换回第一个,写出复合物,弹出保存文件窗口,输出文件是pdbqt格式
这里命名为result.pdbqt。后续可以转换为pdb格式,用如pymol等其他软件进行可视化美化。如果结合能小于-1.2kcal/mol或者小于-5kj/mol,那么我们认为对接结果是可行的,可以选择最低的。