基于多模态零样本学习的条件特异性RNA修饰位点预测新方法ExpressRM

【字体: 时间:2025年07月11日 来源:Briefings in Bioinformatics 6.8

编辑推荐:

  本研究针对现有RNA修饰预测方法依赖同条件训练数据的局限性,开发了多模态零样本学习框架ExpressRM。该创新方法通过整合基因组和RNA-seq数据,首次实现了无需匹配表观转录组数据的跨条件m6A位点预测,在37种人类组织测试中达到0.566的Matthew相关系数,并在胶质母细胞瘤案例中成功揭示TGF-β等关键通路,为探索RNA修饰的动态调控机制提供了突破性工具。

  

在生命科学领域,RNA修饰如同神秘的分子密码,其中N6-甲基腺苷(m6A)是最丰富的信使RNA修饰,参与从发育到疾病的多种调控过程。然而传统检测技术如MeRIP-seq(甲基化RNA免疫共沉淀测序)成本高昂且通量有限,导致组织特异性修饰图谱严重缺失。更棘手的是,现有计算方法都陷入"同条件训练"的困境——预测脑组织m6A需要先有脑组织的修饰数据,这种"先有鸡还是先有蛋"的矛盾极大限制了研究范围。

南京中医药大学江苏省中药功能物质重点实验室的研究团队另辟蹊径,开发出革命性的ExpressRM框架。这项发表于《Briefings in Bioinformatics》的研究突破性地采用多模态零样本学习策略,仅需常规RNA-seq数据就能预测未知条件下的RNA修饰位点。研究人员整合了12种高分辨率检测技术生成的427,760个单碱基m6A位点,通过卷积神经网络处理序列特征,结合Geo2vec提取的空间特征和转录组编码的条件原型,构建了跨组织预测模型。关键技术包括:基于exomepeak2的修饰水平定量、多尺度自适应池化序列编码、以及SHAP(Shapley加性解释)驱动的模型可解释性分析。

条件特异性预测性能卓越
在37种人类组织的基准测试中,ExpressRM的零样本预测达到0.566 MCC(马修斯相关系数),媲美需要同条件训练数据的传统方法。当仅输入胶质母细胞瘤细胞系GOS-3的RNA-seq数据时,模型准确识别出THBS1等关键基因的修饰位点,这些基因在TGF-β通路中的调控作用已获实验验证。

动态修饰与管家修饰的精准区分
模型成功区分出占20.69%的泛组织修饰位点和31.8%的组织特异性位点。地理特征分析显示,条件特异性空间信息(如外显子边界距离)比通用基因组特征预测效果提升37%,揭示了修饰动态性的结构基础。

疾病机制的新发现
在胶质母细胞瘤案例中,SHAP分析筛选出的200个高影响力基因显著富集于Hedgehog信号通路(P=1.2×10-5)和内质网蛋白加工通路。其中血小板反应蛋白1(THBS1)的表达差异达8.7倍,其通过CD47互作促进肿瘤侵袭的机制与独立研究高度吻合。

这项研究开创了表观转录组学研究的新范式。通过解耦RNA修饰预测与特定实验条件的绑定关系,ExpressRM使得常规转录组数据即可用于探索RNA修饰的动态调控,为癌症等疾病的分子机制研究提供了全新视角。该方法特别适用于临床样本分析,有望加速发现疾病特异性修饰靶点,推动精准医疗发展。未来通过整合纳米孔直接RNA测序等新技术,或将进一步拓展其在多修饰类型、跨物种研究中的应用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号