
-
生物通官微
陪你抓住生命科技
跳动的脉搏
NABAS+:基于严格比对的新型宏基因组分类工具在临床诊断中的突破性应用
【字体: 大 中 小 】 时间:2025年07月06日 来源:NAR Genomics and Bioinformatics 4.0
编辑推荐:
本研究针对当前宏基因组分类工具存在的高假阳性率和结果不一致性问题,开发了基于BWA严格比对的NABAS+算法。通过RefSeq精选数据库和多重过滤策略,该工具在CAMI2模拟数据集和Zymo标准样本中展现出优于Kraken2、MetaPhlAn3等主流分类器的精度(Precision 0.719)与灵敏度(Recall 0.719),并在临床病原体检测中实现100%准确率。该成果发表于《NAR Genomics and Bioinformatics》,为临床微生物组诊断提供了可靠解决方案。
微生物组研究在测序技术推动下快速发展,但宏基因组分类仍面临假阳性率高、工具间结果不一致等挑战。现有k-mer分类器(如Kraken2)、标记基因法(如MetaPhlAn3)和比对工具(如GOTTCHA)在临床样本中可能产生矛盾结果,导致误诊风险。匈牙利HUN-REN生物研究中心的Bertalan Takacs团队开发了新型比对分类工具NABAS+(Novel Alignment-based Biome Analyzing Software+),通过严格筛选RefSeq代表性基因组和多重过滤策略,显著提升了分类准确性。
研究采用BWA-MEM(Burrows-Wheeler Aligner)比对算法,构建单物种单基因组的精简数据库。通过CIGAR字符串过滤(允许≤10编辑距离)、基因组覆盖度分析(100分箱法)和非特异性区域排除(覆盖率比值<3.5)等创新步骤,在CAMI2模拟数据集测试中F1分数达0.719,优于Kraken2(0.596)。对ZymoBIOMICS标准样本的分析显示,NABAS+在CSI和CSII数据集分别实现0.594和0.515的Bray-Curtis距离,且零假阳性。临床验证中,20例粪便样本的病原体(如Salmonella enterica)检测结果与PCR培养法完全一致。
主要结果
工具间性能差异:比较8种分类器显示平均Jaccard距离达0.9996,仅5个物种被共同检出(图1)。

CAMI2基准测试:NABAS+在更新基因组后的样本19中Precision提升48.5%(0.484→0.719),证实老旧基因组对分类准确性的影响(表3)。
深度测序标准验证:Zymo CSI样本中NABAS+相对丰度估计最接近真实值(图4A),且唯一实现零假阳性。
临床适用性:19分钟完成百万读长分析,满足临床时效需求,在20例样本中实现100%敏感性与特异性(表5)。
该研究通过创新性的比对过滤流程,解决了宏基因组分类中的核心痛点。NABAS+的严格数据库管理和多重验证机制,使其特别适用于临床病原体检测等需要高可信度的场景。未来可通过纳入长读长数据支持,进一步拓展其在微生物组研究中的应用边界。
生物通微信公众号
知名企业招聘