DeepRNA-Reg:基于深度学习的配对CLIP实验比较分析新方法,精准解析RNA调控网络

【字体: 时间:2025年10月08日 来源:RNA Biology 3.4

编辑推荐:

  本刊推荐:本研究开发了基于深度学习(deep learning)的算法DeepRNA-Reg,用于高通量交联免疫沉淀测序(HITS-CLIP)数据的比较分析。该工具在灵敏度和精确度上显著优于现有方法dCLIP,可更准确地识别Ago2介导的miRNA靶点,并成功应用于揭示T辅助(Th2)细胞中miR-24/27调控II型免疫的新机制,其预测结果在不同生物学环境中展现出优异的可迁移性。

  
背景
RNA结合蛋白(RBP)在转录后基因调控中扮演关键角色,尤其在T细胞激活和免疫应答过程中调控网络复杂。高通量交联免疫沉淀测序(HITS-CLIP)技术可实现特定RBP在转录组范围内RNA相互作用的核苷酸级分辨率检测。配对CLIP实验可揭示不同实验条件下RBP的差异行为,然而针对HITS-CLIP比较分析的算法工具仍然稀缺。此前,dCLIP采用隐马尔可夫模型和维特比算法进行差异富集分析,虽然表现可靠,但在检测灵敏度和精确度方面仍有提升空间。为此,本研究提出DeepRNA-Reg,一种基于深度学习的新型算法,旨在为比较HITS-CLIP分析提供更稳健的解决方案。
结果
基准测试设计
DeepRNA-Reg采用递归神经网络(RNN)推断转录组特定区域的差异富集状态。为验证其效能,研究团队利用Ago2 HITS-CLIP(AHC)数据,检测了在缺失特定microRNA(miRNA)的T细胞中miRNA靶点的识别与定位能力。实验使用了来自小鼠野生型(WT)T辅助2型(Th2)细胞和miR-23、24、27基因敲除(KO)Th2细胞的对比AHC数据,这些KO细胞缺失了编码miR-23、miR-24和miR-27家族所有成员的基因组miRNA簇(Mirc11和Mirc22)。此外,还在Th17细胞中进行了WT与miR-29ab1 KO细胞的对比分析,以验证算法的普适性。
基准测试I:灵敏度
miRNA结合强烈依赖于其“种子区”(第2–8位核苷酸)与目标mRNA中互补序列的Watson-Crick碱基配对。DeepRNA-Reg在识别含有种子结合序列的预测靶点方面显著优于dCLIP。在Th2细胞分析中,DeepRNA-Reg预测的WT富集靶点中包含比dCLIP多80%以上的与miR-23、miR-24或miR-27互补的典型(6–8核苷酸匹配)种子结合序列。同样,在Th17细胞分析中,DeepRNA-Reg也捕获了更多典型的miR-29种子结合序列,且对于所有测试miRNA,其识别的8-mer完美种子结合序列数量也更高。
研究进一步利用TargetScan 7.2数据库评估预测准确性。DeepRNA-Reg不仅覆盖了dCLIP捕获的绝大多数TargetScan预测位点,还显著扩展了捕获范围。例如在Th2细胞中,DeepRNA-Reg预测集与dCLIP捕获的341个TargetScan预测重叠306个,并额外捕获293个新位点。这表明DeepRNA-Reg在保持dCLIP预测完整性的同时,提供了更多具有潜在生物学意义的位点。
基准测试II:精确度
DeepRNA-Reg预测的差异富集区域平均尺寸小于dCLIP,且尺寸分布方差显著更低。在Th2和Th17细胞的两个分析体系中,DeepRNA-Reg预测区域内的典型种子序列和8-mer序列更集中于区域中心,显示出更高的定位精度。统计检验(Mann-Whitney U检验)证实了这种中心化趋势的显著性。
基准测试III:实验验证
为评估各算法在减少假阳性方面的能力,研究利用miRNA模拟物转染实验的数据,检验差异结合富集度量(DBE)与miRNA依赖性基因表达变化的一致性。结果显示,DeepRNA-Reg和dCLIP对于DBE前10%的基因均表现出类似的miRNA诱导表达抑制效果,但DeepRNA-Reg在此置信水平下的预测数量几乎是dCLIP的两倍。
通过分析不同DBE阈值下种子序列 motif 的富集情况,发现DeepRNA-Reg预测集中,随着DBE百分位数限制性增加,miR-23、miR-24和miR-27的种子结合序列富集程度呈现明显升高趋势,而dCLIP中的这一趋势较弱。此外,包含一个或多个相关miRNA种子结合 motif 的区域,其DBE度量也显著更高,这一现象在DeepRNA-Reg中更为突出。
MicroRNA对Th2细胞的调控
研究利用DeepRNA-Reg深入探索了miR-24和miR-27在Th2细胞中的调控网络。算法成功检测到已知靶标mRNA(如Ikzf1、Gata3、Aff4和Gpr174)3’非翻译区(UTR)中miR-27典型结合位点处的差异Ago2结合。同样,在Ikzf1、Cnot6和Clcn3中也发现了miR-24典型结合位点的差异富集。值得注意的是,Il4终止密码子后的miR-24种子结合位点处Ago2结合在KO细胞中并未减少,提示可能存在其他miRNA的调控。
为识别新的直接miRNA靶标,研究整合了DeepRNA-Reg预测集与miRNA模拟物转染后的基因表达数据,并进一步利用Ingenuity Pathway Analysis(IPA)知识库筛选出与IL-4调控相关的高置信度靶基因。分析揭示出一系列影响IL-4表达的转录因子,如Rora、Tcf7、Runx1等,并新发现共刺激受体CD28为miR-24和miR-27的直接靶标。流式细胞术证实,miR-23,24,27 KO Th2细胞表面CD28蛋白表达量升高,与miRNA直接靶向调控的假设一致。
miRNA靶点处的RNA二级结构研究
局部A/U富集程度有助于RISC复合体识别mRNA中的miRNA种子结合序列。独立分析验证了小鼠Th2细胞AHC数据中Ago2结合位点两侧存在两个明显的A/U富集区。进一步利用icSHAPE反应性(一种RNA可及性指标)发现,DeepRNA-Reg预测的miRNA靶点周围存在两个 distinct 低结构区域,该信号在dCLIP预测集中较弱。RNAfold软件模拟的二聚化自由能变化分析也表明, miRNA靶点中心10核苷酸周围存在更正的二聚化自由能变化,提示A/U富集可能通过降低二级结构增加靶标可及性。这一结构特征在DeepRNA-Reg预测集中远较dCLIP清晰。
预测miRNA靶标在不同生物学环境中的可迁移性
研究测试了DeepRNA-Reg预测在不同组织间的有效性。利用Kobayashi等提供的脑缺血再灌注(I/R)损伤模型中miR-29活性降低的数据,发现DeepRNA-Reg在Th17细胞中定义的miR-29靶标在皮质细胞氧糖剥夺(OGD)后也显著上调,且最严格分区下的预测集在表达变化幅度和基因数量上均优于dCLIP。此外,在巨噬细胞iCLIP数据中的独立验证表明,DeepRNA-Reg预测的miR-155靶标在WT与KO条件下的表达差异更显著,且高置信度预测数量多出32%。
讨论
DeepRNA-Reg为比较HITS-CLIP数据分析提供了新工具,其在灵敏度和精确度上均优于现有方法dCLIP。该工具不仅能更有效地识别功能可验证的差异结合区域,还能准确捕捉靶点周围的RNA二级结构特征。值得注意的是,DeepRNA-Reg在一种细胞类型中得到的预测可成功迁移至其他组织类型,表明基于实际CLIP数据构建的miRNA靶标数据库可能具有广泛的应用潜力。随着高通量测序数据的不断积累,DeepRNA-Reg将有助于功能注释RNA相互作用组,深化对基因表达调控网络的理解。
方法
算法框架
DeepRNA-Reg算法输入包括两个处理后的BAM文件和一个BED格式的感兴趣基因组位点文件。处理步骤包括:MA标准化、使用Savitzky-Golay算法去噪、深度学习模型推断、以及差异富集区域调用和DBE(差异结合富集)度量计算。最终,根据DBE值的百分位数对预测区域进行评分。
模型设计与训练
深度学习模型采用三层长短期记忆(LSTM)网络(150, 150, 50单元)和一个稠密层(1单元),总参数量312,051,使用Adam优化器和平均绝对误差损失函数。训练数据来自WT与miR-155 KO的配对HITS-CLIP实验,采用留出验证策略评估模型性能。
数据获取
本研究产生的所有测序数据已保存于NCBI GEO, accession number GSE273503。同时使用了多个已公开数据集进行算法训练和验证。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号