240 发简信
IP属地:上海
  • Resize,w 360,h 240
    化合物分子片段替换与拼接

    需要对多个化合物批量进行特定片段或基团的拼接或替换时,可以参考以下代码。 一、片段的拼接 虽然rdkit中有一个Chem.CombineMols...

  • 存储化合物信息SDF与CSV格式的互相转换

    AIDD流程中常常遇到的数据集格式为csv为主,CADD流程中遇到的则以sdf文件为主,本文分享常用的格式转换代码。 一、SDF文件转CSV文件...

  • rdkit可视化原子序号

    rdkit中对于单个原子的操作,常常是通过GetAtomWithIdx这个函数来实现的,然后可以对该原子做各种下游操作,但对于本身没有明确序号的...

  • Resize,w 360,h 240
    将化合物分子数据标准化(移除电荷、小片段、互变异构、空间信息)

    在AI应用的数据准备阶段,或者化合物数据库归类合并时,会有将同个化合物的不同形式标准化的需求。这样在比对时,就可以通过标准化后的SMILES的字...

  • 并行处理化合物数据方式对比

    rdkit的操作中,对大批量化合物的处理,人们倾向于采用并行化的方式加速处理,例如在Pandas的表格中,采用apply的方式实现化合物属性计算...

  • Resize,w 360,h 240
    化合物数据集的降维可视化

    对于分子聚类后的结果,或者是某个化合物数据集,有时希望可视化后有个直观的对比来确认不同来源的分子集合所占据的化学空间。 但对于化合物这种高维度数...

  • Resize,w 360,h 240
    筛除早期药物发现中有害的PAINS与警示结构

    基于RO5,即Lipinski规则过滤化合物库在早期药物研发项目中已经很常用,但其适用范围往往是限制口服相关的利用度与PK性质。本文介绍基于PA...

  • Resize,w 360,h 240
    药物分子关于RO5等常用属性计算

    药物早期设计中,常常需要根据类药五原则(rule of five,RO5, 亦称Lipinski规则)进行初步判断筛选,RO5是辉瑞公司资深药物...

  • 基于分子指纹的大规模分子聚类

    新药早期研发的应用场景中, 常常需要对虚拟化合物库进行聚类,从不同类别中挑选出多样性好的代表化合物,但视聚类规模对使用的算法与硬件有不同的要求,...