
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多维描述符的配体特异性分子对接工具优选系统LigDockTailor的开发与应用
【字体: 大 中 小 】 时间:2025年06月16日 来源:Computational Biology and Chemistry 2.6
编辑推荐:
针对分子对接中因配体多样性导致的软件选择难题,研究人员通过整合配体理化性质与分子指纹构建多维属性集,开发了基于随机森林的AI分类器LigDockTailor。该模型能精准预测配体适用的对接程序(如Glide/GOLD/Autodock等),并在PDXK抑制剂筛选中验证其提升对接效率与准确性的价值,为计算机辅助药物设计提供了新范式。
分子对接技术作为计算机辅助药物设计(CADD)的核心工具,其通过预测配体(ligand)与受体结合位点的空间构象及相互作用能,极大加速了先导化合物发现进程。然而随着Glide、GOLD、Autodock等数十种对接程序的涌现,研究者面临一个关键困境:不同算法对配体性质存在固有偏好性——例如含多环结构的分子可能被某些程序高估结合力,而柔性分子则易因构象采样不足被误判。这种"软件-配体"兼容性问题直接导致虚拟筛选假阳性率升高,甚至可能使潜在药物分子被错误排除。
针对这一挑战,来自重庆医科大学的研究团队在《Computational Biology and Chemistry》发表研究,创新性地提出"配体导向的对接程序优选"策略。他们从PDBbind-CN数据库v2020精选4039个蛋白-配体复合物,系统分析8种主流对接程序(包括MOE、rDock等)的性能差异,发现分子量、可旋转键数(rotatable bonds)、LogP等12项理化参数与对接成功率显著相关。基于此构建的多维描述符体系,结合随机森林算法开发的LigDockTailor分类器,首次实现了根据配体特性智能推荐最优对接软件的功能。在吡哆醛激酶(PDXK)抑制剂筛选中,该模型指导下的虚拟筛选命中率较传统方法提升2.3倍,成功发现多个新型抑制剂骨架。
关键技术方法包括:1) 从PDBbind-CN数据库构建含4039复合物的数据集(含1294种蛋白/3164种配体);2) 计算ECFP4分子指纹与12项理化描述符;3) 采用8种对接程序评估采样成功率(docking power);4) 建立随机森林多输出分类模型;5) 通过PDXK虚拟筛选进行应用验证。
【Construction of datasets and calculation of molecular descriptors】
研究团队严格筛选非肽类且分子量<500 Da的配体,计算包括拓扑极性表面积(TPSA)、氢键供体数(HBD)等12类特征参数,结合ECFP4指纹构建出214维描述符矩阵。这种多维表征能全面捕捉配体的立体电子特性与药效团特征。
【Evaluation of the sampling power of different docking programs】
对比测试显示不同程序对配体性质存在明显偏好:Glide对高LogP分子表现优异(成功率78%),而LeDock更擅长处理多环刚性分子。关键发现是配体柔性(rotatable bonds>7)会使Autodock Vina的采样成功率骤降41%,证实分子构象复杂性直接影响对接精度。
【Discussion】
研究揭示了程序偏好的双面性:当配体性质与靶标真实需求匹配时(如GPCRs倾向疏水配体),算法偏好可提高筛选效率;反之则引入系统性误差。LigDockTailor通过量化这种关联,为程序选择提供了数据驱动决策依据。
【Conclusion】
该研究不仅证实分子柔性(rotatable bonds)、芳香环数量等是影响对接精度的关键因素,更重要的是建立了首个基于AI的对接程序推荐系统。其创新点在于:1) 突破传统"单程序通用"模式,实现配体特异性对接;2) 为解释不同软件性能差异提供了分子描述符层面的理论依据;3) 在PDXK抑制剂发现中的成功应用,验证了该方法提升药物发现效率的实用价值。这项工作为CADD领域软件选择难题提供了智能化解决方案,未来可通过纳入更多靶标家族数据进一步扩展应用范围。
生物通微信公众号
知名企业招聘