
-
生物通官微
陪你抓住生命科技
跳动的脉搏
纳米孔tRNA测序中的高效条形码解复用技术WarpDemuX-tRNA开发及其在修饰研究中的应用
【字体: 大 中 小 】 时间:2025年09月11日 来源:Nucleic Acids Research 13.1
编辑推荐:
研究人员针对纳米孔直接RNA测序(dRNA-seq)缺乏tRNA特异性解复用工具的问题,开发了WarpDemuX-tRNA(WDX-tRNA)。该方法通过软动态时间规整(soft-DTW)和重心平均技术优化条形码信号分析,实现99%精度和95%回收率,计算效率提升至6分钟/百万读长。该开源工具为tRNA修饰研究提供了高通量、低成本解决方案。
在生命的基本法则中,转移RNA(tRNA)扮演着"分子翻译官"的角色,将遗传密码转化为蛋白质语言。这些长约76-90个核苷酸的小分子表面布满了复杂的化学修饰,目前已发现超过100种修饰类型,它们如同精密调谐的旋钮,调控着蛋白质翻译的准确性和效率。当这些修饰出现异常时,会导致被称为"RNA修饰病"(RNA modopathies)的多种疾病。然而,传统技术难以同时检测tRNA序列及其修饰信息,这成为揭示其生物学机制的重要瓶颈。
纳米孔直接RNA测序(dRNA-seq)技术的出现为这一领域带来曙光。该技术通过测量RNA分子穿过纳米孔时引起的电流变化,实现了单分子水平的序列和修饰检测。但tRNA的特殊性——短长度、高修饰密度、缺乏polyA尾——使得现有解复用技术难以适用。样本混合测序(multiplexing)作为降低成本的关键策略,其核心是条形码识别,而tRNA测序中条形码信号受到3'端接头(splint adapter)的干扰,导致标准方法失效。
这项发表于《Nucleic Acids Research》的研究提出了WarpDemuX-tRNA解决方案。研究团队整合了来自人类(HEK293)、大肠杆菌、酿酒酵母和秀丽隐杆线虫的tRNA样本,通过双连接接头策略构建测序文库。关键技术包括:(1)采用soft-DTW barycenter averaging(软动态时间规整重心平均)生成适配体共识信号;(2)基于特征峰识别DNA-RNA杂交信号边界;(3)开发两阶段分割算法提取条形码指纹;(4)使用CatBoost梯度提升树实现高效分类。
改进的条形码信号提取与指纹生成
研究创新性地利用3'端splint adapter中DNA-RNA交界处的特征高振幅峰作为信号锚定点。如图2所示,通过soft-DBA生成的共识信号可精确定位条形码起始位置,随后进行区域重分割获得优化指纹。主成分分析显示,新方法使不同条形码类别的分离度显著提高(图2F→G)。
直接高效的条形码分类
摒弃原版WarpDemuX(WDX)中耗时的动态时间规整距离计算,直接使用240维指纹特征训练分类器。在独立测试集上达到99%精确度和95%回收率(表1),尤其将条形码4的错误分类率从7.3%降至1%(图3C→D)。计算效率提升63.9%,百万读长处理仅需6分钟(表2)。
分子环境对信号的影响
研究发现标准RTA-polyA与tRNA协议中3'端splint adapter的差异会改变条形码信号特征。额外的DNA腺嘌呤碱基可能降低某些条形码组合(如BC3与BC4)的区分度,这为未来条形码设计优化提供了方向。
这项研究的意义在于:技术上,首次实现纳米孔tRNA测序的高效解复用,通过共识信号分析和机器学习分类的融合策略,解决了短RNA信号解析的难题;应用上,开源工具WDX-tRNA使大规模tRNA修饰研究成为可能,为RNA修饰病的机制研究奠定方法学基础。正如作者强调,该方法原理可扩展至其他非polyA RNA研究,如rRNA或small RNA测序领域。专利保护与开源并行的策略(PCT/EP2024/061629),既保障知识产权又促进学术共享,体现了现代科研的协作精神。
研究也存在若干值得探索的方向:当前条形码容量(4个)仍有扩展空间;DNA-RNA杂交结构对信号的影响机制需更深入研究;未来可整合自适应采样(adaptive sampling)技术进一步提升效率。随着纳米孔技术在表观转录组学(epitranscriptomics)中的应用深化,这类方法学创新将为RNA生物学带来更多突破性发现。
生物通微信公众号
知名企业招聘