可解释性引导的RNA N6-甲基腺苷修饰位点预测:基于可逆神经网络的多尺度结构解析

【字体: 时间:2025年07月10日 来源:Communications Biology 5.2

编辑推荐:

  本研究针对RNA m6A修饰位点预测中模型可解释性不足和结构信息利用不充分的问题,开发了m6A-IIN模型。该模型通过可逆神经网络整合RNA一级与二级结构信息,在11个跨物种组织数据集上实现SOTA性能(AUC平均提升7.7%),并首次揭示甲基化相关区域(如结合环)在泛癌基因鉴定中的关键作用,为癌症生物学提供新视角。

  

在真核生物RNA中,N6-甲基腺苷(m6A)作为最丰富的转录后修饰之一,通过调控RNA剪接、稳定性和翻译过程影响基因表达。然而,现有m6A位点检测技术如抗体免疫沉淀法存在抗体依赖性限制,而纳米孔测序需m6A-free对照样本。计算预测方法虽取得进展,但深度学习模型常被视为"黑箱",且普遍忽视RNA二级结构对修饰位点的关键影响——已知m6A易出现在茎环结构的环区,但尚无模型有效整合该信息。

为突破这些瓶颈,中国科学院新疆理化技术研究所的研究团队开发了m6A-IIN(Interpretability-guided Invertible Neural Network),通过可逆神经网络框架融合RNA一级序列和二级结构信息,实现了高精度且可解释的m6A位点预测。该成果发表于《Communications Biology》,揭示了甲基化相关区域的跨物种保守规律及其在泛癌基因鉴定中的应用价值。

核心方法
研究采用四阶段架构:(1)利用RNAfold计算RNA二级结构,以邻接矩阵表示碱基互作;(2)构建交叉结构耦合模块,通过环表示投影(LRP)将二级结构的环信息映射至一级序列,通过核苷酸关联映射(NCM)学习序列相关性;(3)结合ELMo语义编码与图小波神经网络(GWNN)对齐多尺度特征;(4)设计区域注意力机制,通过可逆变换溯源关键甲基化相关区域。模型在11个人/鼠/大鼠组织数据集上进行5折交叉验证。

研究结果

  1. 性能优势
    m6A-IIN在11个数据集上AUC达0.906,较基线方法(TandemMod/GR-m6A等)平均提升7.7%(图2a)。消融实验表明:移除环投影(LRP)使准确率下降3.1%,证实二级结构贡献显著(图2b)。跨物种验证中,鼠-大鼠组的性能(Acc=0.856)显著优于人-鼠组(Acc=0.790),暗示进化亲缘关系影响甲基化模式(图4a)。

  2. 结构可及性机制

    • 结合环与修饰位点存在空间协同:52.7%阳性样本同时存在结合域(如"RRACH"基序)和环结构(图3a)。
    • 环结构提升结合可及性:当m6A阅读蛋白TAF15的结合基序"GGUG"位于环内时,分子对接评分(-8.2)显著高于茎区(-5.3)(图3b-c),因茎区碱基互作阻碍蛋白结合。
    • 侧翼序列重要性:修饰位点上下游区域(如H-k数据集中的"CUACA")通过TomTom数据库匹配到PCBP1等RNA结合蛋白(图3e),突变该区域使结合评分上升43%(图3f)。
  3. 跨组织泛癌基因鉴定

    • 组织保守区域占比30.4%(脑)-36.9%(肝)(图5b)。
    • 结合区域数量在泛癌基因中显著富集(p<0.0001):经典泛癌基因平均29个,候选基因28个,非癌基因仅23个(图5c)。
    • 筛选出12个候选基因(如COL6A3/ANK3/PIK3CD),其表达在6类癌症中显著变化(如PIK3CD在肾癌/胆管癌/肝癌中差异表达),且均与黏着斑/Focal adhesion通路相关(图5g)。

结论与意义
m6A-IIN首次通过可逆神经网络框架实现RNA多尺度结构的协同建模,不仅将m6A位点预测精度推至新高,更开创了从结构可及性角度解析修饰机制的新范式。该模型揭示:环结构通过增强局部可及性促进m6A修饰;结合域分布具有跨组织保守性,可作为泛癌基因筛选标志物(如COL6A3经实验验证与甲基转移酶METTL3互作)。值得注意的是,模型在跨物种验证中发现脂肪酸代谢通路(ko00071)与MAPK信号(ko04024)的关联在鼠类中保守,但在人类中减弱,暗示m6A可能参与物种特异的代谢调控演化。

未来工作需整合RNA三级结构数据以进一步提升精度,并拓展至更多物种及疾病模型。本研究的代码与数据已开源(https://github.com/ZLSRW/m6A-IIN),为表观转录组学与癌症靶向治疗提供全新工具和视角。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号