消息传递神经网络中优化器对分子属性预测性能的系统性评估及其在药物发现中的应用

【字体: 时间:2025年06月16日 来源:Computational Biology and Chemistry 2.6

编辑推荐:

  本研究针对分子属性预测任务中优化器选择缺乏系统评估的问题,通过对比SGD、Adam、AdamW等8种优化器在消息传递神经网络(MPNN)中的表现,发现自适应梯度优化器显著提升模型收敛稳定性和分类准确率,为药物发现和材料科学中的GNN模型优化提供重要指导。

  

在化学信息学和药物发现领域,准确预测分子属性是开发新药和功能材料的基础。传统分子表示方法如SMILES字符串(如γ-丁内酯的"CC(C)CNC1CCCC1=O")虽便于人类理解,却难以被计算机模型直接处理。随着图神经网络(Graph Neural Networks, GNN)的兴起,特别是消息传递神经网络(Message Passing Neural Networks, MPNN)的出现,分子属性预测取得了显著进展。然而,一个长期被忽视的关键问题是:不同优化算法如何影响MPNN模型的性能?现有研究多聚焦于网络架构改进,而对优化器选择这一"隐形引擎"的系统性研究仍属空白。

由Ul Rahman Jamshaid、Hasnain Ali和Rasool Areen组成的研究团队在《Computational Biology and Chemistry》发表的研究填补了这一空白。该研究首次对8种主流优化器(包括SGD、Adam、AdamW等)在MPNN分子分类任务中的表现进行了全面评估。通过NCI-1(3,466个抗癌活性化合物)和BACE(抑制剂数据集)两个基准数据集,研究团队采用统一实验设置(学习率1e-4
,权重衰减1e-4
,SinLU激活函数),每种优化器重复训练5次以控制变量。

关键技术方法包括:1)基于SMILES的分子图表示转换;2)MPNN框架下的消息传递机制;3)八种优化器的并行对比(SGD、带动量的SGD、Adagrad、RMSprop、Adam、NAdam、AMSGrad、AdamW);4)使用二进制交叉熵损失函数;5)100轮训练的稳定性评估。

不同优化器变体
研究详细解析了从1981年基础SGD到2018年AdamW的优化算法演进历程。特别关注了AdamW通过解耦权重衰减解决Adam系列优化器的过拟合问题,以及AMSGrad改进收敛保证的理论优势。

数据集
NCI-1数据集提供"活性/非活性"二元标签,BACE数据集则聚焦β-分泌酶1抑制剂分类。这两个数据集在节点度分布、图稀疏性和类别不平衡方面具有代表性差异,可全面检验优化器的适应性。

实验设置
严格控制超参数一致性,采用五重复实验消除随机性影响。值得注意的是,研究选用SinLU(Sinusoidal ReLU)作为激活函数,其周期性特性有助于捕捉分子轨道特征。

结论
自适应梯度优化器(AdamW、AMSGrad)在收敛速度和分类准确率上显著优于传统SGD。具体表现为:1)训练曲线更平滑,验证损失波动降低40-60%;2)在NCI-1数据集上达到最高0.89 AUC;3)对分子图的结构变化展现更强鲁棒性。这一发现颠覆了早期研究中简单采用Adam作为默认选择的惯例。

讨论
该研究首次建立优化器选择与分子GNN性能的定量关系,揭示自适应方法能有效处理分子图中的长程依赖问题。特别在药物发现场景下,AdamW的稳定表现可减少约30%的重复实验成本。作者指出未来方向应包括:1)优化器与3D分子构象的协同研究;2)针对多任务学习的定制化优化策略;3)结合DTF-diffusion等生成模型的联合优化框架。这项研究为精准医疗时代的计算药物设计提供了关键的算法选择指南。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号