
-
生物通官微
陪你抓住生命科技
跳动的脉搏
纳米孔测序技术在高度致病性细菌基因组精确组装中的应用与挑战
【字体: 大 中 小 】 时间:2025年08月29日 来源:BMC Genomics 3.7
编辑推荐:
本研究针对纳米孔测序(ONT)在高度致病性细菌基因组组装中的准确性问题,系统评估了不同组装策略对Ba. anthracis、Br. abortus等6种低突变率病原菌的适用性。研究通过比较dorado/guppy等碱基识别器、flye/miniasm等组装工具及medaka等抛光方法,发现81%的错误位于编码区,甲基化导致6.5%的错误,而细菌甲基化感知模型medakaBM可显著提高准确性。该研究为疫情分析提供了可靠的ONT单技术组装方案,成果发表于《BMC Genomics》。
在微生物基因组学领域,高度致病性细菌的精准基因组组装一直是疫情分析和分子分型的基石。传统上,Illumina短读长测序与纳米孔长读长测序的混合组装被视为金标准,但对于资源有限的小型实验室而言,这种双技术路线往往难以实现。更棘手的是,像Bacillus (Ba.) anthracis(炭疽杆菌)和Brucella (Br.) spp.(布鲁氏菌)这类低突变率病原体,即使单个核苷酸的差异也可能成为区分疫情爆发的关键。牛津纳米孔技术(ONT)虽然以其长读长优势在基因组连续性方面表现出色,但其特有的系统误差模式——尤其是甲基化引起的碱基识别错误——给下游分析带来了巨大挑战。
《BMC Genomics》最新发表的研究通过系统评估不同组装策略,为这一难题提供了解决方案。研究团队选取了6种具有代表性的高度致病菌(包括Ba. anthracis Ames Ancestor和Br. melitensis 16M等),采用ONT R10.4.1化学试剂进行测序,并与Illumina数据和Sanger测序参考基因组进行比对。为扩大研究范围,还纳入了Hall等公布的14种食源性和公共卫生相关病原体数据。研究创新性地开发了一套自动化分析流程,系统比较了dorado duplex/simplex和guppy等不同碱基识别器,以及flye、miniasm等组装工具与medaka等抛光方法的组合效果。
关键技术方法包括:使用dorado v500模型进行碱基识别,Filtlong过滤reads,flye组装后采用细菌甲基化感知模型medakaBM进行抛光;通过Quast评估组装质量,Modkit分析甲基化位点,BUSCO评估完整性;利用minimap2将reads映射至参考基因组,samtools分析覆盖度;采用SeqSphere+进行cgMLST分型,阈值设为5个等位基因差异。
研究结果呈现多个重要发现:
碱基识别器比较:dorado duplex在多数情况下表现最优,平均组合错误率Ecombined=2.36,但Br. abortus等特定菌株使用dorado simplex可减少1-13个错误位点。模型v430对Br. abortus效果最佳,而v500在多数菌株中表现最优。

组装策略评估:flye+medakaBM组合最常产生最优组装(17/20菌株),但不同菌株的最佳策略存在差异。例如Ba. anthracis通过raven+clair3获得近乎完美组装,而K. pneumoniae的最佳策略(flye+racon+clair3)仍存在47个错误。值得注意的是,抛光过程有时会降低质量,如medakaBM使Sa. enterica错误从9个激增至379个。
错误特征分析:81%的错误位于编码序列(CDS)中,25.6%源于同聚物区域(如Ba. anthracis中19bp和38bp的"A"缺失),6.5%与甲基化相关。关键甲基化基序GATC和GANTC在K. pneumoniae和Br. melitensis中引发错误,而细菌甲基化感知模型使甲基化相关错误从90个降至42个。

cgMLST影响:尽管存在错误,所有ONT组装的cgMLST等位基因差异均小于5个阈值。例如Ba. anthracis所有ONT组装与参考基因组零差异,而Illumina组装因低覆盖度(2-8X)出现3个位点差异。Br. melitensis中,ONT与Illumina在关键位点出现"C"/"G"歧义,反映甲基化导致的碱基识别模糊。
Christine Thomas等的研究证实,纳米孔测序可实现对部分高度致病菌的完美基因组组装(如L. monocytogenes和Sta. aureus),但性能存在显著物种依赖性。甲基化感知模型的引入使ONT在表观遗传研究方面独具优势,而持续的技术改进(如dorado v0.9.6的计算优化)有望进一步提升准确性。该研究为资源有限实验室开展单技术病原体基因组监测提供了可靠方案,同时指出生物安全三级病原体在训练数据集中的代表性不足问题,为ONT未来的算法优化指明了方向。这些发现对疫情实时监测和精准分型具有重要实践意义,特别是在应对炭疽、布鲁氏菌病等重大传染病时。
生物通微信公众号
知名企业招聘