
-
生物通官微
陪你抓住生命科技
跳动的脉搏
MPNN-CWExplainer:融合类加权损失与可解释性的HIV药物生物活性预测增强框架
【字体: 大 中 小 】 时间:2025年07月05日 来源:Life Sciences 5.2
编辑推荐:
本刊推荐的研究解决了HIV药物生物活性预测中的类不平衡(class imbalance)和模型解释性差的问题,研究者开发了MPNN-CWExplainer框架,整合消息传递神经网络(Message Passing Neural Network, MPNN)、类加权损失(class-weighted loss)和GNNExplainer,通过贝叶斯超参数优化(Bayesian hyperparameter optimization)提升鲁棒性,实现了87.631%的AUC-ROC和86.02%的AUC-PRC,显著优于基线模型。该框架不仅提高预测准确性,还提供分子级可解释性,为抗HIV药物发现(drug discovery)提供透明化工具,支持先导化合物优化。
HIV(人类免疫缺陷病毒)作为一种逆转录病毒,持续威胁全球健康,导致免疫系统衰竭和AIDS(获得性免疫缺陷综合征)进展。尽管抗逆转录病毒疗法(如蛋白酶抑制剂和整合酶抑制剂)已取得进展,但药物耐药性、副作用和病毒突变仍是重大挑战。当前,计算机辅助药物发现(Computer-Aided Drug Discovery, CDD)依赖于深度学习模型预测分子生物活性,但面临两大瓶颈:数据集类不平衡(少数活性化合物样本不足)导致预测偏差,以及模型“黑箱”特性缺乏解释性,使得药物化学家难以信任和利用预测结果。这些问题阻碍了新药开发进程,急需一种兼顾准确性和透明性的解决方案。为此,研究人员开展了针对HIV生物活性预测的创新研究,开发出MPNN-CWExplainer框架,旨在提升预测性能并提供分子级可解释性,为加速抗HIV药物设计提供科学依据。
研究团队采用多项关键技术:首先,利用MoleculeNet benchmark的HIV数据集(包含超过40,000个化合物),通过SMILES字符串编码为图结构;其次,构建消息传递神经网络(Message Passing Neural Network, MPNN)处理分子图,整合类加权损失函数(class-weighted loss)以校正类不平衡问题;第三,引入GNNExplainer进行事后解释(post-hoc interpretability),识别关键原子和键级子结构;最后,通过贝叶斯超参数优化(Bayesian hyperparameter optimization)和50次独立运行确保模型鲁棒性,训练集、验证集和测试集按8:1:1比例划分。
研究结果如下:
研究结论和讨论强调,MPNN-CWExplainer通过类加权损失和GNNExplainer,有效解决了类不平衡和解释性缺陷,成为HIV药物发现的可靠工具。其重要意义在于:框架的预测性能(如AUC-PRC 8
生物通微信公众号
知名企业招聘