MPNN-CWExplainer:融合类加权损失与可解释性的HIV药物生物活性预测增强框架

【字体: 时间:2025年07月05日 来源:Life Sciences 5.2

编辑推荐:

  本刊推荐的研究解决了HIV药物生物活性预测中的类不平衡(class imbalance)和模型解释性差的问题,研究者开发了MPNN-CWExplainer框架,整合消息传递神经网络(Message Passing Neural Network, MPNN)、类加权损失(class-weighted loss)和GNNExplainer,通过贝叶斯超参数优化(Bayesian hyperparameter optimization)提升鲁棒性,实现了87.631%的AUC-ROC和86.02%的AUC-PRC,显著优于基线模型。该框架不仅提高预测准确性,还提供分子级可解释性,为抗HIV药物发现(drug discovery)提供透明化工具,支持先导化合物优化。

  

HIV(人类免疫缺陷病毒)作为一种逆转录病毒,持续威胁全球健康,导致免疫系统衰竭和AIDS(获得性免疫缺陷综合征)进展。尽管抗逆转录病毒疗法(如蛋白酶抑制剂和整合酶抑制剂)已取得进展,但药物耐药性、副作用和病毒突变仍是重大挑战。当前,计算机辅助药物发现(Computer-Aided Drug Discovery, CDD)依赖于深度学习模型预测分子生物活性,但面临两大瓶颈:数据集类不平衡(少数活性化合物样本不足)导致预测偏差,以及模型“黑箱”特性缺乏解释性,使得药物化学家难以信任和利用预测结果。这些问题阻碍了新药开发进程,急需一种兼顾准确性和透明性的解决方案。为此,研究人员开展了针对HIV生物活性预测的创新研究,开发出MPNN-CWExplainer框架,旨在提升预测性能并提供分子级可解释性,为加速抗HIV药物设计提供科学依据。

研究团队采用多项关键技术:首先,利用MoleculeNet benchmark的HIV数据集(包含超过40,000个化合物),通过SMILES字符串编码为图结构;其次,构建消息传递神经网络(Message Passing Neural Network, MPNN)处理分子图,整合类加权损失函数(class-weighted loss)以校正类不平衡问题;第三,引入GNNExplainer进行事后解释(post-hoc interpretability),识别关键原子和键级子结构;最后,通过贝叶斯超参数优化(Bayesian hyperparameter optimization)和50次独立运行确保模型鲁棒性,训练集、验证集和测试集按8:1:1比例划分。

研究结果如下:

  • Aims(目标):本研究旨在改善HIV生物活性预测,并通过可解释性洞察分子决定因素。研究人员聚焦于开发一个框架,解决类不平衡和模型透明性问题,以支持药物发现决策。
  • Materials and methods(材料与方法):通过整合MPNN和类加权损失,框架优化节点表示更新(message-passing operations),同时采用GNNExplainer提供解释性。贝叶斯优化超参数(如学习率和层数)确保泛化能力。
  • Key findings(关键发现):MPNN-CWExplainer在HIV数据集上实现最高预测性能,AUC-ROC达87.631%,AUC-PRC达86.02%,超越基线模型。类加权方法增强少数类表示,GNNExplainer成功识别化学有意义的子结构(如活性分子中的关键键),与生物活性相关。
  • Significance(意义):该框架不仅提升预测准确率,还增强模型透明性,使研究者能理解分子行为,支持先导化合物优化(lead optimization)和分子设计,推动计算药物发现。

研究结论和讨论强调,MPNN-CWExplainer通过类加权损失和GNNExplainer,有效解决了类不平衡和解释性缺陷,成为HIV药物发现的可靠工具。其重要意义在于:框架的预测性能(如AUC-PRC 8

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号