
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态特征融合与对比图神经网络的药物-靶标相互作用预测模型GraphCF研究
【字体: 大 中 小 】 时间:2025年06月25日 来源:Artificial Intelligence in Medicine 6.1
编辑推荐:
本研究针对药物-靶标相互作用(DTI)预测中多模态特征融合不足和3D结构利用有限的问题,提出GraphCF模型,通过MixHop聚合器、图对比学习和跨注意力融合模块,整合序列、网络和3D结构特征,在四个公开数据集上实现AUC提升1.7%、F1-Score提升5.2%的显著性能,为药物发现提供新思路。
药物研发的核心挑战之一是高效预测药物与靶标蛋白的相互作用(DTI)。传统生物实验成本高、耗时长,而现有计算方法多局限于单一模态特征,如1D序列或2D网络结构,忽视3D构象信息,且缺乏有效的多模态交互机制。此外,数据稀缺导致模型泛化能力差,传统图卷积网络(GCN)难以捕获长程依赖关系。这些问题严重制约了DTI预测的准确性。
为解决上述问题,中国科学院的研究人员Dianlei Gao和Fei Zhu在《Artificial Intelligence in Medicine》发表研究,提出GraphCF模型。该工作创新性地融合序列、拓扑网络和3D结构特征,通过MixHop高阶聚合、图对比学习增强表征,并设计跨注意力融合模块,在DrugBank等四个数据集上实现性能突破。研究证实,3D结构特征与多模态交互机制可显著提升DTI预测的判别力,为药物重定位和虚拟筛选提供新工具。
关键技术包括:1)基于MixHop的图神经网络聚合DTI拓扑网络的高阶邻域信息;2)图对比学习增强数据稀缺下的表征判别性;3)CNN和GNN分别提取序列与3D结构特征;4)跨注意力机制动态融合多模态特征。实验采用DrugBank、DrugCentral、Human和C.elegans数据集,数据来源于DRKG知识图谱。
研究结果
结论与意义
GraphCF首次将3D结构信息与拓扑网络、序列特征协同建模,通过对比学习和高阶信息聚合解决数据稀疏问题。其跨注意力融合机制为多模态生物数据整合提供普适性框架,推动AI在药物设计中的应用。未来可扩展至蛋白质-蛋白质相互作用预测等领域。
(注:全文内容均基于原文提炼,未添加非文献信息,专业术语如MixHop、AUPR等均保留原文格式。)
生物通微信公众号
知名企业招聘