
-
生物通官微
陪你抓住生命科技
跳动的脉搏
MAPTrans:基于动态元路径剪枝与互注意力Transformer的药物重定位新方法
【字体: 大 中 小 】 时间:2025年07月30日 来源:Briefings in Bioinformatics 6.8
编辑推荐:
本研究针对药物重定位中异质数据整合不足和多尺度交互建模的难题,提出MAPTrans模型。通过自注意力增强的元路径特征聚合(SA-MFA)和自适应多视图评分机制(AMVIS),动态优化药物-疾病表征,并设计互注意力Transformer(TMAMF)实现跨视图特征融合。实验表明,MAPTrans在C-dataset和F-dataset上的AUC分别达0.9717和0.9648,显著优于AMDGT等基线模型,为加速药物研发提供新思路。
药物研发领域长期面临周期长、成本高的挑战,传统方法平均需耗时10年以上。如何通过计算手段挖掘已批准药物的新适应症(药物重定位,Drug Repositioning),成为突破研发瓶颈的关键策略。然而,现有方法如NIMCGCN和LAGCN等存在明显局限:异质生物数据(药物-疾病-蛋白质)整合能力不足,且忽视生物系统的多层级交互特征。更棘手的是,元路径(meta-path)实例计算复杂度随实体数量激增,而多视图重要性评估机制缺失导致噪声干扰严重。
青岛大学计算机科学技术学院的研究团队在《Briefings in Bioinformatics》发表创新研究,提出MAPTrans模型。该模型通过动态元路径剪枝与互注意力Transformer架构,成功实现药物-疾病关联的精准预测。核心突破在于:首次将自注意力机制引入元路径特征聚合(SA-MFA),设计跨视图互注意力模块(TMAMF),并开发自适应多视图评分(AMVIS)动态筛选关键特征。实验证实其预测性能显著超越现有最佳模型AMDGT(AUPR提升达10.21%),尤其在样本稀疏场景下表现优异。
关键技术包括:1) 基于RDKit指纹和ESM2蛋白语言模型的节点特征构建;2) 自注意力增强的4层元路径特征聚合;3) 余弦相似度驱动的动态视图剪枝(top-k=2);4) 互注意力Transformer实现药物-疾病跨视图交互;5) 异质图神经网络(HGTLayer)传播蛋白特征。研究采用C-dataset(663药物/409疾病)和F-dataset(593药物/313疾病)验证,通过10折交叉验证和分子对接实验双重验证预测结果。
自注意力增强元路径特征聚合
通过设计MP-Drug-1/2/3/4等元路径,创新性引入Query-Key-Value三元组(公式2-3),使节点特征权重可动态学习。如图2所示,该方法较传统GCN能更精准捕获高阶邻域依赖关系,节点表征区分度提升23%。
自适应多视图重要性评分
基于余弦相似度(公式6-8)的AMVIS机制实现关键视图筛选。实验显示当k=2时性能最优(图4),有效消除冗余视图干扰,使模型在F-dataset的AUPR提升至0.7238。
互注意力Transformer融合
TMAMF模块(公式9-13)通过共享注意力权重,实现药物-疾病特征双向交互。如图3所示,该设计使冷启动场景下AUC仍保持0.9648,较单向注意力架构提升6.83%。
异质图特征传播
通过HGTLayer(公式14)将蛋白特征整合至药物-疾病节点,补充生化通路信息。如表5所示,该方法成功预测出卡比多巴(Carbidopa)与乙酰胆碱酯酶(AChE)的新型结合模式(结合能-7.6 kcal/mol,图8),为阿尔茨海默病治疗提供新候选。
该研究开创性地将动态元路径剪枝与互注意力机制结合,突破传统方法仅关注单视图或单向交互的局限。分子对接实验验证了预测结果的生物合理性,如西他生坦(Sitaxentan)与AChE的关键残基相互作用(图9)。特别值得注意的是,在训练样本减少50%的极端情况下,模型AUPR仍达0.2944(图6),显著优于对比模型。研究团队指出,未来可进一步融合超图对比学习(hypergraph contrastive learning)等新技术,深化多视图语义融合策略。这项工作为加速药物发现提供强大工具,其框架也可拓展至其他生物分子关系预测领域。
生物通微信公众号
知名企业招聘