《Nature Communications》:Comprehensive comparison of the third-generation sequencing tools for bacterial 6mA profiling

【字体: 时间:2025年04月29日 来源:Nature Communications 14.7

编辑推荐:

  为解决细菌 DNA 6mA 检测工具的性能评估及优化问题,研究人员开展了对八种相关工具的评估研究。结果显示不同工具性能各异,SMRT 和 Dorado 表现突出,同时提出优化方法提升了 Dorado 性能。该研究为工具改进和表观遗传研究提供了重要参考。

在生命的微观世界里,细菌的奥秘一直吸引着科学家们不断探索。细菌的 DNA 甲基化作为一种重要的表观遗传修饰,其中 DNA N6 - 甲基腺嘌呤(6mA)在细菌的各种生物学过程中扮演着关键角色。然而,长期以来,用于细菌 6mA 研究的先进测序技术和分析工具十分有限。这就好比在黑暗中摸索,缺乏有效的照明工具,使得我们对细菌 6mA 的了解受到极大限制。一方面,现有的检测方法存在诸多不足,如免疫印迹和液相色谱 - 质谱(LC - MS)虽能半定量检测甲基化,但无法精准定位具体的甲基化碱基;二代测序技术如 6mA 免疫沉淀测序(6mA - IP - seq)和亚硝酸盐测序,虽分辨率有所提升,但只能识别数十个碱基对片段的甲基化模式,且严重依赖抗体或化学试剂的质量。另一方面,三代测序(TGS)技术虽取得了显著进展,如 PacBio 的单分子实时(SMRT)测序和 Oxford Nanopore Technologies(ONT)的纳米孔测序,但针对细菌 6mA 检测的相关工具仍有待系统评估和优化。在这样的背景下,为了深入了解细菌 6mA 的奥秘,香港城市大学的研究人员开展了一项全面而深入的研究。

研究人员收集了 SMRT 和七种基于纳米孔测序数据检测细菌 DNA 6mA 的工具进行评估。他们以丁香假单胞菌 pv. phaseolicola 1448A(Psph)为主要研究对象,同时对另外五种细菌菌株进行了交叉验证。通过一系列严谨的实验设计和数据分析,研究取得了一系列重要成果。


在研究方法上,研究人员首先对细菌进行培养,提取 DNA 并进行全基因组扩增(WGA)。利用纳米孔测序(使用 R9.4.1 和 R10.4.1 流动池)和 SMRT 测序对样本进行处理。针对不同工具的特点,采用相应的方法进行数据分析,如使用 minimap2 和 samtools 过滤未比对的读数,利用 SeqKit 进行统计分析等。为了评估工具性能,构建了多种数据集,并采用了多种评估指标,包括精度召回曲线(PRC)、受试者工作特征曲线(ROC)和 F1 分数等。


研究结果部分,首先是 6mA 检测的基准策略。研究人员对测序数据进行了全面的质量评估,结果显示纳米孔测序平均测序深度至少为 241×,平均读长至少为 2579 bp,SMRT 测序平均覆盖深度为 297×,且 R10.4.1 测序数据的平均 Q 分数比 R9.4.1 高 1.63 倍,为后续分析提供了可靠的数据基础。同时,根据已知的甲基转移酶(MTase)基序特异性,推导了 6mA 位点特异性的基准事实,并对不同工具的输出进行了标准化处理。


其次,在基序发现方面,研究发现 Psph 主要存在两种 6mA 基序,大多数工具在 WT 数据集上能较好地识别基序,但 Tombo_denovo 存在偏向质粒信号的问题。在 ΔhsdMSR 和 LOST 数据集上,SMRT、Dorado、Hammerhead、Nanodisco 和 Tombo_levelcom 表现出色,能准确识别基序,而 mCaller 也显示出一定的基序发现潜力。


然后是 6mA 分析的性能比较。在单核苷酸 / 5 - 聚体水平的 6mA 检测中,SMRT、Dorado 和 Tombo_levelcom 表现出较高的可靠性。在 WT 数据集中,SMRT 表现最佳,平均精度(AP)和 F1 分数分别达到 0.958 和 0.933;Dorado 的最大 F1 分数为 0.412,ROC 值为 0.992。然而,在处理 ΔhsdMSR 菌株的测序结果时,SMRT 和 Dorado 的性能有所下降,Tombo_levelcom 在低 6mA 位点丰度样本分析中表现出优势。在单分子水平,SMRT 在 WT 和 ΔhsdMSR 数据集中的 F1 分数分别为 0.955 和 0.442,Dorado 的修饰分数更为稳定。


接着是 6mA 检测准确性评估。通过设定工具特定的阈值,研究人员发现 SMRT 在单碱基分辨率的 6mA 检测中表现卓越,假阳性率低。与其他工具相比,SMRT 的异常值检测较少,且异常值与基准事实数据的交集小。同时,研究发现减去 WT 和 WGA 数据集中的共同位点可显著降低 Dorado、mCaller 和 Tombo_denovo 的假阳性率。


此外,通过与 6mA - IP - seq 结果比较,发现有 14 个甲基化位点未被三代测序工具检测到,这表明当前技术存在一定的局限性。研究还发现 R10.4.1 流动池在捕获碱基信号差异方面优于 R9.4.1 流动池,能更敏感地检测到甲基化诱导的电流差异。


针对上述结果,研究人员提出了优化方法,通过去除 WT/ΔhsdMSR 和 WGA 结果的交集,可提高工具与基准事实的重叠度,该方法显著提升了 Dorado 在单核苷酸分辨率上的性能。同时,研究发现 Dorado 在测序深度达到 50× 时,输出结果高度一致,且在 450× 时 F1 分数达到峰值。


在对五种细菌菌株的交叉验证中,研究人员评估了 SMRT、Dorado 和 Tombo_levelcom 的性能。结果显示 SMRT 能识别所有规范基序,Dorado 和 Tombo 分别检测到 9/10 和 5/10 个基序。SMRT 在单分子准确性分析中表现出色,但在大肠杆菌 K - 12 分析中性能下降。优化后的 Dorado 在所有菌株中的 F1 分数和精度分数均有所提高。


研究结论和讨论部分,该研究全面比较了 SMRT 和七种纳米孔相关计算工具在细菌 6mA 检测方面的性能,为后续工具的优化和开发提供了重要依据。研究发现目前的检测工具存在各自的局限性,如纳米孔测序受电流信号影响,难以达到单碱基分辨率;现有工具在检测低丰度甲基化位点时存在困难等。因此,建立细菌 6mA 检测的金标准至关重要。同时,研究提出的优化方法为提高 6mA 检测准确性提供了新的思路,有望推动细菌甲基化组研究的进一步发展,帮助科学家们更深入地了解细菌的表观遗传系统,为相关疾病的研究和治疗提供理论基础。


订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号