知识增强与引导的图对比学习用于分子性质预测

【字体: 时间:2025年05月20日 来源:Expert Systems with Applications 7.5

编辑推荐:

  分子性质预测(MPP)是 AI 辅助药物发现的核心任务,现有分子图对比学习面临分子图增强保留化学语义和对比目标捕捉精确先验知识的挑战。研究人员提出 KEGGCL 方法,实验表明其在 10 个 MoleculeNet 数据集上表现优异,为 MPP 提供新方向。

  在 AI 辅助药物发现的广阔领域中,分子性质预测(Molecular Property Prediction, MPP)宛如一把关键钥匙,肩负着加速设计与发现具有理想性质分子的重任。然而,这一过程却受困于标注分子数据稀缺的难题。自监督学习(Self-Supervised Learning, SSL)的兴起带来了曙光,作为 SSL 主流方法之一的对比学习,却在分子图领域遭遇两大 “拦路虎”:一是如何进行分子图增强,使其在变换中完好保留分子化学语义;二是怎样设定对比目标,精准捕捉先验知识。倘若无法妥善解决这些问题,对比学习在分子性质预测中的潜力便难以充分释放,甚至可能在部分下游任务中出现负迁移现象。
为冲破这一困境,大连理工大学等机构的研究人员开展了深入研究,相关成果发表在《Expert Systems with Applications》。他们提出了知识增强与引导的图对比学习方法(Knowledge Enhanced and Guided Graph Contrastive Learning, KEGGCL),为分子性质预测领域带来了新的解决方案。

研究人员主要采用了以下关键技术方法:基于从 SMILES 转换而来的特征分子图,利用化学元素领域知识构建两种增强分子图,分别为面向元素内特征的分子图(G2)和面向元素间关系的分子图(G3),且这两种增强分子图与特征分子图(G1)拓扑结构相同,不会改变分子化学结构;采用药物相似性定量估计(Quantitative Estimate of Drug-likeness, QED)指导对比空间中样本表示的相似或距离程度;利用通信消息传递神经网络(CMPNN)在特征分子图和两种增强分子图上进行处理以实现最终预测。

实验对比分析


通过在 10 个 MoleculeNet 基准数据集上的实验,将 KEGGCL 与现有先进方法进行对比,结果表明 KEGGCL 在分子性质预测任务中表现出显著优势,验证了其有效性和优越性。

增强分子图合理性验证


为探究两种增强分子图在对比自监督学习中的合理性,研究人员进行了相关实验。结果显示,引入元素知识构建的增强分子图能够有效辅助模型学习,表明其在对比学习框架中是合理且必要的。

分子图信息互补性分析


针对特征分子图和两种增强分子图是否为最终预测结果提供互补信息这一问题,研究人员开展了实验。实验结果表明,三者相互补充,共同为准确预测分子性质提供了丰富的信息支持。

知识引导对比学习优势验证


通过实验对比基于知识引导的图对比学习与其他对比学习方式,发现 KEGGCL 所采用的知识引导方式能够使模型更精准地捕捉先验知识,在分子性质预测任务中展现出明显优势。

KEGGCL 通过整合化学元素背景知识进行分子图增强,并利用 QED 实现知识引导的图对比学习,成功解决了现有分子图对比学习中的关键挑战。该方法为分子性质预测提供了一种新的图对比学习范式,有助于更高效地学习精确先验知识,提升分子性质预测的准确性,为 AI 辅助药物发现领域的发展注入了新动力,有望加速新型药物的研发进程,在应对疾病挑战和保障人类健康方面具有重要的应用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号