MoleProLink-RL:基于几何传输与策略强化学习的药物-靶点相互作用预测新框架
《npj Digital Medicine》:MoleProLink-RL: geometric transport for domain-policy reinforcement learning in drug-target interaction prediction
【字体:
大
中
小
】
时间:2025年11月25日
来源:npj Digital Medicine 15.1
编辑推荐:
本文推荐一项针对药物-靶点相互作用(DTI)预测中分布偏移问题的创新研究。研究人员开发了MoleProLink-RL模型,通过几何最优传输(Wasserstein距离)与强化学习策略优化相结合,实现了跨化学结构、蛋白家族和实验条件的领域自适应。该研究在Human、C. elegans和Davis数据集上验证了模型优越性(AUC最高达98.13%),为药物发现中的泛化性瓶颈提供了端到端的解决方案。
在现代药物发现中,计算模型已成为筛选海量化合物与蛋白质相互作用的关键工具。然而,一个长期存在的瓶颈是:在特定实验条件下训练的模型,当面对新的化学结构、蛋白家族或检测方法时,预测性能往往会显著下降。这种分布偏移(distribution shift)问题严重制约了计算模型在真实药物研发场景中的应用。传统方法通常将特征对齐与决策优化割裂处理,导致模型难以在变化的环境中保持稳定的排序精度。
针对这一挑战,来自复旦大学附属中山医院、上海交通大学医学院附属瑞金医院等机构的研究团队在《npj Digital Medicine》上发表了题为"MoleProLink-RL: geometric transport for domain-policy reinforcement learning in drug-target interaction prediction"的研究论文。该研究提出了一种名为MoleProLink-RL的创新框架,将几何最优传输与策略强化学习相结合,实现了从分子表示到决策策略的端到端领域自适应。
该研究的核心创新在于建立了统一的数学框架,将表示对齐(representation alignment)与策略适应(policy adaptation)通过几何视角进行耦合。具体来说,研究团队设计了Fisher-Wasserstein积分概率度量(FWIPM),融合了Wasserstein距离对分布低频位移的捕捉能力与最大均值差异(MMD)对高频失配的敏感性。同时,通过Fisher-Rao信息几何为参数空间更新提供度量结构,确保表示漂移与决策漂移的协同演化。
为验证方法的有效性,研究团队在三个标准数据集上进行了系统评估:Human(人类药物-靶点相互作用)、C. elegans(线虫模型生物)和Davis(激酶-抑制剂相互作用)。这些数据集涵盖了从单物种到跨物种、从广泛靶点到特异性蛋白家族的不同场景,为评估模型泛化能力提供了全面基准。
关键技术方法方面,研究采用图Transformer(Graph Transformer)进行药物分子编码,利用双向Mamba状态空间模型(State Space Model)处理蛋白质序列,通过DTI感知的Wasserstein距离实现分布对齐,并引入基于强化学习的策略优化器在潜在子环境中稳定排名决策。数据来源于公开数据库(DrugBank、GLASS、UniProt等),涵盖1,052种药物与852个靶点的3,369个已验证相互作用。
研究结果显示,MoleProLink-RL在三个数据集上均取得最优性能。在Human数据集上,AUC达到97.34%,AUPR为97.57%;在C. elegans数据集上,AUC为98.13%,AUPR高达98.92%;即使在最具挑战性的Davis数据集(激酶家族内部高相似性)上,AUC也达到90.08%,显著优于所有基线模型。这一致性优势表明该框架能有效适应不同生物语境和复杂度水平的数据分布。
消融实验通过系统移除关键模块评估了各组分的贡献。当去除Mamba蛋白编码模块时,AUC下降0.09%-3.64%,AUPR下降0.30%-5.11%;而去除KAN(Kolmogorov-Arnold Network)解码器则导致特征整合能力显著受损。结果表明,双向Mamba模块对长序列上下文建模至关重要,而KAN的注意力机制能动态加权分子特征,二者协同作用不可或缺。
案例研究进一步揭示了模型的工作原理。以阿司匹林与激酶靶点的相互作用预测为例,模型通过图Transformer识别药物的氢键和π-π作用药效团,同时Mamba模块定位关键结合残基(如LYS-121、GLU-81)。跨注意力热图显示,这些结构特征的协同分析将相互作用概率从0.28提升至0.78。Fisher-Rao流形上的几何轨迹则证明了参数更新的平滑性与稳定性。
讨论部分指出,该研究建立了DTI预测中领域自适应的严格数学基础,其理论贡献包括:提出DTI-Wasserstein距离量化领域差异,推导目标风险传递的理论上界,以及通过几何传输算子实现参数空间的协同演化。实践层面,框架的模块化设计(如可调整的传输代价函数、稳定性正则化强度)使其能灵活适配不同药物研发场景的需求。
该研究的局限在于未探索多源领域适应(multi-source domain adaptation)场景,且当前未整合蛋白质结构等额外分子模态。未来工作可扩展至多实验平台数据融合,并开发能处理部分结构信息的距离度量方法。
总之,MoleProLink-RL通过几何传输与策略强化学习的有机结合,为DTI预测中的分布偏移问题提供了原则性解决方案。其端到端的联合优化范式确保分子表示学习与决策策略在领域迁移中协同进化,显著提升了模型在真实药物发现环境中的实用价值。这一框架不仅推动了计算药物发现的方法学前沿,也为应对生物医学数据异质性挑战提供了新范式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号