
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态加权残差图卷积自编码器的药物-靶标相互作用预测新方法研究
【字体: 大 中 小 】 时间:2025年07月31日 来源:BMC Bioinformatics 3.3
编辑推荐:
本研究针对药物-靶标相互作用(DTIs)预测中图神经网络深度受限和训练机制不足的问题,提出了一种集成动态加权残差图卷积网络(DWR-GCN)和双重自监督联合训练机制(DSJT)的图卷积自编码模型DDGAE。该研究通过创新性地设计动态权重卷积层和残差连接,有效解决了深层网络过平滑问题,结合空间软一致性约束(SSCC)和对抗约束的三重优化策略,在多个公开数据集上实现了AUC 0.9600和AUPR 0.6621的优异性能,为加速药物发现和重定位提供了新工具。
在药物研发领域,准确预测药物与靶标蛋白的相互作用(Drug-Target Interactions, DTIs)是发现新药和药物重定位的关键环节。然而,传统生物医学方法存在耗时长、成本高、容错率低等局限,特别是在COVID-19等突发疫情中更显不足。虽然基于计算的预测方法如分子对接、配体相似性等取得进展,但现有图卷积网络(GCN)方法普遍存在两个瓶颈:浅层网络难以提取高阶语义信息,且缺乏有效的训练引导机制。这些问题严重制约了DTIs预测的准确性和可靠性。
针对这些挑战,赣南师范大学数学与计算机科学学院的研究团队在《BMC Bioinformatics》上发表了一项创新研究。他们开发了名为DDGAE的新型图卷积自编码模型,通过三个关键技术突破:1)设计动态加权残差图卷积模块(DWR-GCN),采用余弦相似度动态调整邻域聚合权重,结合残差连接防止过平滑;2)提出双重自监督联合训练机制,整合图卷积自编码器(GCA)辅助训练;3)引入包含空间软一致性约束(SSCC)的三重优化策略。研究使用DrugBank、HPRD等公开数据集构建异构网络,采用LightGBM分类器处理样本不平衡问题。
研究方法上,团队首先整合多源数据构建药物-靶标异构网络,通过WKNKN算法对稀疏矩阵进行稠密化处理。特征学习阶段采用5层DWR-GCN架构,其中第2-4层为动态加权残差层,通过余弦相似度ω=cosine(E(l),?(l+1))实现自适应特征融合。训练过程结合重构损失LresX、KL散度损失Ldsjt和对抗损失LG进行联合优化。特别设计的SSCC通过线性缩放稀疏化保留原始相似度信息,相比硬划分方法更精确。
研究结果部分呈现了三个关键发现:
性能比较实验显示,DDGAE在AUC(0.9600)和AUPR(0.6621)指标上显著优于8种基线模型。与次优的SDGAE相比,AUC提升1.72%,AUPR提高4.35%;在top 5%候选靶标中平均召回率达82.94%,验证了模型识别潜在DTIs的能力。
消融实验证实各模块的贡献:移除DWR层使AUPR下降2.73%,取消双重自监督机制导致AUC降低0.4%,而SSCC的缺失使AUPR显著降低5.5%,说明空间约束对处理类别不平衡至关重要。
案例研究验证了模型预测新DTIs的能力。对喹硫平、氯氮平等五种药物的top10预测靶标中,50个候选有20个经DrugBank证实,14个获STITCH支持。分子对接显示阿立哌唑与ADRA2C通过LEU-1100形成氢键,为实验验证提供了方向。
这项研究的意义在于:首先,DWR-GCN通过动态权重和残差连接突破了深层GCN的局限性,为图神经网络架构设计提供了新思路;其次,双重自监督机制实现了端到端训练,提高了有限阳性样本的利用率;最后,SSCC等创新优化策略显著提升了模型在真实不平衡数据中的表现。该方法不仅适用于DTIs预测,还可扩展至药物-药物相互作用、推荐系统等链接预测任务,特别是在COVID-19等紧急药物研发中具有应用潜力。研究者特别指出,未来工作将探索Transformer与图神经网络的协同优势,并进一步优化计算效率以处理更大规模生物网络。
生物通微信公众号
知名企业招聘