
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度势能注意力机制(DPA-2)的药物分子神经网络势能模型实现从头算精度
【字体: 大 中 小 】 时间:2025年08月26日 来源:Research 10.7
编辑推荐:
计算机辅助药物设计(CADD)领域迎来突破性进展!研究人员开发出基于深度势能注意力架构(DPA-2)的神经网络势能模型DPA-2-Drug,可精准预测含H/C/N/O/F/S/Cl/P八种元素的类药分子相互作用。该模型通过温度加速和增强采样技术构建训练集,在扭转扫描、结构弛豫和高温分子动力学(MD)模拟中展现出媲美ωB97XD/6-31G**密度泛函理论(DFT)的化学精度,计算效率较半经验方法显著提升,为药物开发提供全新工具。
在计算机辅助药物设计(CADD)领域,精确计算分子间相互作用犹如寻找"化学罗盘"——传统量子力学(QM)方法虽准确但计算成本高昂,而经典力场方法又牺牲了精度。这种"鱼与熊掌"的困境严重制约了新药研发效率。更棘手的是,类药分子化学空间估计达1060量级,其构象空间更是浩瀚无垠,这对机器学习(ML)模型的表征能力提出空前挑战。
为破解这一难题,研究团队创新性地开发了DPA-2-Drug深度势能模型。这项发表于《Research》的研究,通过融合注意力机制的神经网络架构与智能采样策略,成功实现了药物分子势能面(PES)的精准重构。研究人员采用多管齐下的技术路线:首先基于ChEMBL29数据库构建含8种关键元素(H/C/N/O/F/S/Cl/P)的分子库;继而运用DP-GEN平台的并发学习算法,结合温度加速(300-750K)和OPES增强采样技术,高效构建含140万构型的训练集;最终采用6层repformer的DPA-2架构,以6?和4?双截断半径捕捉近远程相互作用。
在"扭转构象"测试中,模型在Genentech、Biaryl和TorsionNet-500数据集上展现出惊人精度:扭转势垒高度平均绝对误差(MAEB)仅0.22 kcal/mol,100%体系误差<1 kcal/mol化学精度阈值。相较于ANI-2x和Schr?dinger-ANI等现有模型,DPA-2-Drug在二维扭转剖面预测中同样优势显著,半胱氨酸二肽体系能量误差控制在30 kcal/mol范围内。
"结构弛豫"实验揭示,当以DFT优化结构为起点时,DPA-2-Drug与参考DFT的几何构型均方根偏差(RMSD)仅0.23?,80%体系的能量差<1 kcal/mol。值得注意的是,即便对含20-70个重原子的复杂分子(远超训练集尺寸),模型仍保持优异表现,显著优于GFN2-xTB等半经验方法。
在最具挑战性的"高温MD模拟"中,750K下3ns的轨迹分析显示,模型对相对能量的MAE稳定在1.5 kcal/mol左右,力预测MAE约0.7 kcal/mol/?。与AIMNet2、MACE-OFF23等先进模型相比,DPA-2-Drug在保持精度的同时,对148原子体系仍保持51ms/步的运算速度,较GFN2-xTB提速6倍以上。
这项研究标志着药物分子模拟进入"量子精度+经典效率"的新纪元。DPA-2-Drug模型不仅填补了传统QM方法与力场间的技术鸿沟,其创新的并发学习策略更将训练集规模压缩至传统方法的1/4。尽管当前模型尚无法处理带电体系和自由基,但其架构已为引入长程静电作用预留空间。该成果为虚拟筛选、构象预测等药物研发关键环节提供了变革性工具,其技术框架更可拓展至材料设计、催化反应等领域,展现出广阔的跨学科应用前景。
生物通微信公众号
知名企业招聘