基于多源异构图神经网络与多层次注意力机制的lncRNA-miRNA互作预测模型LMI-MM研究

【字体: 时间:2025年06月28日 来源:International Journal of Biological Macromolecules 7.7

编辑推荐:

  针对传统实验方法耗时耗力且现有计算模型对异构图节点特征融合不足的问题,研究人员提出LMI-MM模型,整合lncRNA/miRNA序列、理化性质及疾病-药物-mRNA多源异构网络,通过图神经网络(GNN)与多层次注意力机制实现高精度互作预测,AUC/AUPR指标显著提升,为ceRNA调控机制研究和疾病靶点发现提供新工具。

  

在生命科学领域,长链非编码RNA(lncRNA)和微小RNA(miRNA)的相互作用(LMI)如同细胞内的"分子对话",调控着基因表达和疾病进程。传统实验方法如同用显微镜逐个观察拼图碎片,虽精确但效率低下;而现有计算模型又常忽略"对话"中的关键参与者——疾病、药物等中间节点,导致预测精度受限。这种困境在阿尔茨海默病、卵巢功能早衰等复杂疾病研究中尤为突出,亟需能整合多维度生物信息的智能预测工具。

河北大学的研究团队在《International Journal of Biological Macromolecules》发表的研究中,提出了革命性的LMI-MM模型。该研究首先构建了包含665个lncRNA、295个miRNA、316种疾病及小分子药物的多源异构网络,创新性地采用双轨特征提取策略:通过图卷积网络(GCN)挖掘序列/结构等固有属性特征,同时利用图表示学习捕捉网络拓扑特征。更巧妙的是,模型引入三级注意力机制(层间/节点/特征级),像"智能调音台"般动态调节不同信息的权重,最终在10折交叉验证中实现AUC 0.92的优异表现。

关键技术方法包括:基于RNA2Vec预训练矩阵的特征编码、lncRNA-miRNA-疾病-药物-mRNA异构网络构建、图注意力网络(GAT)与对比学习的联合优化,以及跨模态注意力融合。数据集来自Zhou等最新整理的生物数据库,涵盖ALCAM、TRIM2等关键基因的调控数据。

研究结果部分:

  1. 多源异构网络构建:整合DO(疾病本体)、KEGG等数据库,构建包含5类节点、11种边关系的生物网络,显著提升节点中心性表征。
  2. 特征提取优化:相比传统GCN,采用残差连接的图神经网络使特征维度压缩效率提升37%,H3K4me3等表观遗传标记的识别准确率提高21%。
  3. 注意力机制验证:特征级注意力层对miR-223-3p等调控因子的权重分配差异达4.8倍,证实模型能捕捉关键生物标记。
  4. 跨物种性能测试:在阿尔茨海默病相关MERRICAL/CCL4通路预测中,AUPR值达0.89,较基线模型GCLMTP提高19%。

结论与讨论指出,LMI-MM的创新性体现在三方面:首次将药物靶点纳入ceRNA网络建模,突破传统仅关注疾病节点的局限;通过WDR5-MLL1复合物等案例验证了模型在揭示转录调控机制方面的优势;开发的通用框架可扩展至RNA-蛋白质互作预测。局限性在于对miRNA前体/成熟体转换过程的建模尚待完善,未来拟整合单细胞测序数据进一步提升预测精度。这项研究为破解"lncRNA-miRNA-mRNA"调控三角的分子密码提供了全新范式,对发展靶向RNA的精准医疗具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号