mol2文件分子名称的批量修改

1. 目的及思路

   一般软件在读取 *.mol2 文件时,依据文件内部的标注确定分子名称,而非文件名。*.mol2 文件结构(仅展示包含分子名称的前几行)如下图所示,#为首的行是Sybyl软件生成的注释,可以看到,分子名称在该文件的第9行(不一定),即@<TRIPOS>MOLECULE的下一行(一定),该分子名为IAA。

#   Name:           IAA
#   Creating user name: XiyangLee
#   Creation time:      Wed Jun 19 15:25:24 2019

#   Modifying user name:    XiyangLee
#   Modification time:  Wed Jun 19 15:27:21 2019

@<TRIPOS>MOLECULE
IAA
   22    23     1     1     0
SMALL
GAST_HUCK


@<TRIPOS>ATOM
      1 C1         -0.7976   -6.3164   -0.6615 C.2       1 BENZYL      0.0193 
      2 N2          0.2258   -5.7519   -0.0713 N.pl3     1 BENZYL     -0.2884 
      3 C2          1.3929   -6.1123   -0.6404 C.ar      1 BENZYL      0.0606 
      4 C3          1.1440   -6.9808   -1.6852 C.ar      1 BENZYL     -0.0193 
...

  为了使软件正确读取我们所希望的分子名称,我们在修改分子名称时需要将 *.mol2 文件内的名称一并修改。本文所介绍方法的思路为:1. 利用cmd批量修改 *.mol2 文件名;2. 利用Python读取文件名并替换文件内的旧分子名。

2. 操作方法

2.1 批量修改 *.mol2 文件名

  考虑到批处理对象数目一般较为庞大,我们首先从获取文件名称开始。

  在*.mol2文件所在目录新建一个txt文件,输入dir /a-d /b *.mol2* >>文件名.txt,保存后修改该文件后缀为bat,双击执行该bat文件,即可获得该目录下所有*.mol2文件的名称;

  新建一个Excel文件,在第二列粘贴需要修改的文件名,第一列的单元格填充ren,第三列输入修改后的文件名称,与第二列一一对应,如图1所示;随后将该文件另存为csv文件;

图1:Excel文件结构

  使用Notepad++(或其他文本编辑器)打开保存的csv文件,将所有的,替换为(空格),这样每一行都符合cmd修改文件名的语法格式:ren oldname.xxx newname.xxx,保存后将文件名后缀csv改为bat,双击执行即可批量修改该目录下的 *.mol2 文件名。

2.2 批量修改 *.mol2 文件内的分子名称

  新建Python文档,输入并执行以下代码即可。

import os
import re

path = "C:/Users/Admin/Jupyter/MolecularRename/All" # \*.mol2 文件所在文件夹目录,注意删除非mol2文件
files = os.listdir(path) #得到文件夹下的所有文件名称
s = []
for file in files: #遍历文件夹
    if not os.path.isdir(file): #判断是否是文件夹,不是文件夹才打开
        f = open(path+"/"+file,"r+"); #打开文件
        iter_f = iter(f); #创建迭代器
        new=[]
        for line in iter_f: #遍历文件,一行行遍历,读取文本
            new.append(line)
        newname = "".join(re.findall(r'(.+?)\.mol2',file)) #将文件名作为分子名称;"".join():将list转为str;r'(.+?)\.mol2':去除文件名后缀;
        new[0]= '#  Name:           '+ newname +'\n'
        new[8]= newname + '\n'
        f.seek(0)
        for n in new:
            f.write(n)
        f.close()
print('Work done.')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容

  • 个人学习批处理的初衷来源于实际工作;在某个迭代版本有个BS(安卓手游模拟器)大需求,从而在测试过程中就重复涉及到...
    Luckykailiu阅读 4,660评论 0 11
  • 在进行文件批量处理的过程中,总是不可避免的会遇到批量修改文件名称的问题,例如对文件夹名称的修改,对文章中配图...
    _Frank_Lee_阅读 3,098评论 2 6
  • 基础用法 批量修改文件名不是很容易吗?只需要使用第三方工具不就可以了吗?为什么还要使用Excel? 因为这次我们要...
    五月小闲人阅读 14,364评论 0 14
  • 在学习工作中,经常会需要将文件夹名称批量修改,并且每个文件夹名称需要改为指定的名称,单个修改效率太低,现将批量修改...
    鲸鱼_eba8阅读 48,142评论 3 9
  • 朋友们,大家周一好。 今天,我早早地驱车来医院就诊,现在已经十点半,在我前面还有二十多个病人在焦急地等待。 大家议...
    泺伊悦尔阅读 201评论 0 2