
-
生物通官微
陪你抓住生命科技
跳动的脉搏
可解释性引导的RNA N6-甲基腺苷修饰位点预测:基于可逆神经网络的多尺度结构解析
【字体: 大 中 小 】 时间:2025年07月10日 来源:Communications Biology 5.2
编辑推荐:
本研究针对RNA m6A修饰位点预测中模型可解释性不足和结构信息利用不充分的问题,开发了m6A-IIN模型。该模型通过可逆神经网络整合RNA一级与二级结构信息,在11个跨物种组织数据集上实现SOTA性能(AUC平均提升7.7%),并首次揭示甲基化相关区域(如结合环)在泛癌基因鉴定中的关键作用,为癌症生物学提供新视角。
在真核生物RNA中,N6-甲基腺苷(m6A)作为最丰富的转录后修饰之一,通过调控RNA剪接、稳定性和翻译过程影响基因表达。然而,现有m6A位点检测技术如抗体免疫沉淀法存在抗体依赖性限制,而纳米孔测序需m6A-free对照样本。计算预测方法虽取得进展,但深度学习模型常被视为"黑箱",且普遍忽视RNA二级结构对修饰位点的关键影响——已知m6A易出现在茎环结构的环区,但尚无模型有效整合该信息。
为突破这些瓶颈,中国科学院新疆理化技术研究所的研究团队开发了m6A-IIN(Interpretability-guided Invertible Neural Network),通过可逆神经网络框架融合RNA一级序列和二级结构信息,实现了高精度且可解释的m6A位点预测。该成果发表于《Communications Biology》,揭示了甲基化相关区域的跨物种保守规律及其在泛癌基因鉴定中的应用价值。
核心方法
研究采用四阶段架构:(1)利用RNAfold计算RNA二级结构,以邻接矩阵表示碱基互作;(2)构建交叉结构耦合模块,通过环表示投影(LRP)将二级结构的环信息映射至一级序列,通过核苷酸关联映射(NCM)学习序列相关性;(3)结合ELMo语义编码与图小波神经网络(GWNN)对齐多尺度特征;(4)设计区域注意力机制,通过可逆变换溯源关键甲基化相关区域。模型在11个人/鼠/大鼠组织数据集上进行5折交叉验证。
研究结果
性能优势
m6A-IIN在11个数据集上AUC达0.906,较基线方法(TandemMod/GR-m6A等)平均提升7.7%(图2a)。消融实验表明:移除环投影(LRP)使准确率下降3.1%,证实二级结构贡献显著(图2b)。跨物种验证中,鼠-大鼠组的性能(Acc=0.856)显著优于人-鼠组(Acc=0.790),暗示进化亲缘关系影响甲基化模式(图4a)。
结构可及性机制
跨组织泛癌基因鉴定
结论与意义
m6A-IIN首次通过可逆神经网络框架实现RNA多尺度结构的协同建模,不仅将m6A位点预测精度推至新高,更开创了从结构可及性角度解析修饰机制的新范式。该模型揭示:环结构通过增强局部可及性促进m6A修饰;结合域分布具有跨组织保守性,可作为泛癌基因筛选标志物(如COL6A3经实验验证与甲基转移酶METTL3互作)。值得注意的是,模型在跨物种验证中发现脂肪酸代谢通路(ko00071)与MAPK信号(ko04024)的关联在鼠类中保守,但在人类中减弱,暗示m6A可能参与物种特异的代谢调控演化。
未来工作需整合RNA三级结构数据以进一步提升精度,并拓展至更多物种及疾病模型。本研究的代码与数据已开源(https://github.com/ZLSRW/m6A-IIN),为表观转录组学与癌症靶向治疗提供全新工具和视角。
生物通微信公众号
知名企业招聘