基于多实例异构图网络的可解释性CircRNA-药物敏感性关联预测模型MiGNN2CDS研究

【字体: 时间:2025年05月15日 来源:BMC Biology 4.4

编辑推荐:

  为解决circRNA(环状RNA)与药物敏感性关联(CDSA)预测效率低、成本高的问题,研究人员开发了基于多实例学习(MIL)和异构图神经网络(GCN)的MiGNN2CDS模型。该模型通过伪元路径实例生成器和双向翻译嵌入投影器BiTrans学习circRNA-药物对的元路径级表征,结合多尺度注意力网络实现高精度预测和可解释分析。实验表明,MiGNN2CDS在预测准确性和模型可解释性上均优于现有方法,为精准医疗提供了新工具。

  

在癌症治疗领域,circRNA(环状RNA)的表达水平显著影响细胞对化疗药物的敏感性,但传统生物实验耗时耗力且成本高昂。例如,circKDM4C通过调控miR-548p/PBLD轴增强阿霉素敏感性,circRNA-CREIT可提升三阴性乳腺癌对阿霉素的响应。然而,现有计算方法如MNGACDA、GATECDA等虽采用图神经网络(GCN),却忽略了异构图(heterogeneous graph)中元路径(metapath)的关键作用,且缺乏模型可解释性分析。

为此,电子科技大学基础与前沿研究院等机构的研究团队开发了MiGNN2CDS模型,通过整合多实例学习(MIL)与异构图卷积网络(HGCN),实现了circRNA-药物敏感性关联(CDSA)的高精度预测和机制解析。该研究发表于《BMC Biology》,为药物重定位和个体化治疗提供了新思路。

研究采用四大关键技术:1)基于Levenshtein距离和GIPKS(高斯相互作用谱核相似性)构建circRNA与药物的综合相似性特征;2)设计异构图卷积层(HGCN)提取节点嵌入;3)开发伪元路径实例生成器和双向翻译嵌入投影器BiTrans学习元路径表征;4)通过多尺度注意力网络实现预测与可解释分析。数据来源于GDSC数据库的80,076组关联,涵盖404种circRNA和250种药物。

参数分析
通过对比学习率策略(如step-based scheme和Adam),确定step-based方案最优,准确率达0.9。BiTrans模块在7项指标上平均提升4%-18%,显著优于简单的sum或mean聚合方法。

模型鲁棒性分析
训练过程中AUC和损失曲线稳定收敛,五折交叉验证(FFCV)的AUC均值为0.9486,表明模型无过拟合且泛化能力强。

消融实验
移除HGCN层(MiGNN2CDS-HGCN)或注意力机制(MiGNN2CDS-Attn)均导致性能显著下降,验证了各模块的必要性。

跨算法比较
MiGNN2CDS的AUC(0.945)远超随机森林(RF)和支持向量机(SVM),较推荐算法(recomm)提升13%。与疾病关联预测模型(如MKGCN和GANLDA)相比,其准确率提高10.3%。

案例研究
预测甲氨蝶呤(methotrexate)的20个潜在关联circRNA中,14个经CTPR数据库验证;克唑替尼(crizotinib)的Top16预测全部验证,证实模型实用性。

可解释性分析
以"ASPH-Trametinib"为例,模型识别出关键元路径"ASPH-CUX1-trametinib-nilotinib",两者均为酪氨酸激酶抑制剂,含吡啶并嘧啶结构,其化学相似性和文献证据支持预测可靠性。

结论与意义
MiGNN2CDS首次将MIL与异构图网络结合,解决了CDSA预测中的稀疏性和可解释性难题。其创新性体现在:1)伪元路径生成增强生物学意义挖掘;2)BiTrans模块优化实例表征;3)多尺度注意力机制提供决策依据。尽管计算复杂度较高,但该模型为circRNA靶向治疗和药物重定位提供了高效工具,未来可通过动态元路径学习进一步提升性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号