《Environmental Technology & Innovation》:Systematic Evaluation of Metagenomic Sequencing Workflows for Pathogen Identification and Relative Quantification in Mock Coastal Seawater
编辑推荐:
宏基因组下一代测序(mNGS)技术可实现样本中所有微生物遗传物质的无偏倚表征,在海洋环境研究中应用日益广泛,为海水源性微生物的病原体鉴定及相对定量提供了重要技术手段。然而,由于海水基质复杂且工作流程存在差异,mNGS在沿海海水中的应用性能仍需系统评估。为此,研
宏基因组下一代测序(mNGS)技术可实现样本中所有微生物遗传物质的无偏倚表征,在海洋环境研究中应用日益广泛,为海水源性微生物的病原体鉴定及相对定量提供了重要技术手段。然而,由于海水基质复杂且工作流程存在差异,mNGS在沿海海水中的应用性能仍需系统评估。为此,研究人员构建了包含14种代表性微生物的海水模拟参考样本,系统评价了整合4种DNA提取方法、3种测序平台及其对应文库制备试剂盒以及3种分类分类器的28种工作流程。研究采用精确率(Precision)、召回率(Recall)和F1-score评估定性准确性,采用假阳性相对丰度(False Positive Relative Abundance, FPRA)和相似度指数(Similarity)评估定量准确性。结果表明,在测试变量中,DNeasy PowerWater试剂盒获得最高的DNA回收效率;Illumina NovaSeq 6000测序平台结合TrueLib mRNA文库制备试剂盒 consistently 优于其他平台;Kraken2-Bracken在优化阈值条件下提供了最优的分类学注释。整合DNeasy PowerWater或PowerSoil Pro试剂盒、Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒以及Kraken2-Bracken的工作流程实现了最佳的整体准确性,属水平F1-score超过0.90。相比之下,其他组合如DNeasy PowerSoil Pro试剂盒或CTAB法、MGISEQ-2000平台结合TruePrep Flexible DNA文库制备试剂盒以及Kaiju分类器,在优化阈值条件下F1-score低于0.40。该研究强调了方法学前评价对于确保公共卫生和环境应用中获得稳健数据的必要性。
该研究发表于《Environmental Technology》,旨在解决沿海海水mNGS工作流程缺乏系统评价的问题。海洋微生物群落生物量约为10
4–10
6 cells/mL,主要由浮游细菌组成,对环境变化敏感,可作为生态系统稳定性的指示指标。同时,与游泳或食用生海鲜相关的人类感染问题日益受到关注。尽管mNGS技术已广泛应用于各种海洋环境,但海水mNGS研究仍面临挑战,因其工作流程复杂,从样本采集、核酸提取、测序到生物信息学分析的每个方法学选择都可能显著影响准确性。已有研究对个别方法步骤进行了基准测试,但系统评价不同方法步骤联合影响的研究仍然有限。
研究人员构建了包含14种代表性沿海海水微生物的模拟海水参考样本,涵盖厚壁菌门(Firmicutes)、放线菌门(Actinobacteria)、变形菌门(Proteobacteria)和子囊菌门(Ascomycota)中的物种,这些微生物均已在海水检出且与人类健康相关。考虑到海水微生物生物量固有的低丰度特征,研究采用大体积过滤以确保下游测序的DNA产量。过滤富集后,分别使用4种DNA提取方法(DNeasy PowerWater Kit、DNeasy PowerSoil Pro Kit、DNeasy Blood & Tissue Kit及定制CTAB法),在3种测序平台(Illumina NovaSeq 6000、MGISEQ-2000和Oxford Nanopore PromethION 48)及其对应文库制备试剂盒(分别为TrueLib mRNA Library Prep Kit、TruePrep Flexible DNA Library Prep Kit和Ligation Sequencing Kit 1D)上进行测序。为评价不同分类学分类策略,研究选择了3类代表性分类器:基于DNA-to-DNA比对的Kraken2-Bracken、基于DNA-to-protein比对的Kaiju,以及基于标记基因的MetaPhlAn4;此外,针对ONT长读长数据,还纳入了与纳米孔测序数据兼容的Melon作为额外的基于标记基因的分类器。研究共建立了28种工作流程(编号W01–W28),采用定性和定量指标评估技术变量及整体工作流程的性能,从而确定沿海海水病原体鉴定和相对定量的最优工作流程。
主要技术方法包括:模拟海水样本制备(14种微生物菌株来源于美国典型培养物保藏中心ATCC和中国医学细菌保藏中心CMCC,经扫描电子显微镜SEM确认细胞壁完整,Sanger测序及BLAST分析验证菌株纯度,微滴式数字PCR ddPCR确定绝对浓度,将其加入无菌人工海水中制备模拟样本)、大体积过滤富集(0.22 μm滤膜)、DNA提取及产量测定、文库构建与测序、FastQC和fastp质量控制、多相对丰度阈值优化分析(包括无阈值及0.001%至5%系列阈值)、分类学注释与丰度分析,以及基于NIBSC和CAMI II基准方法学框架的综合评价体系(精确率、召回率、F1-score、假阳性相对丰度和相似度指数)。
**DNA提取方法的影响**
DNA产量与提取偏差比较:DNeasy PowerWater试剂盒获得最高DNA产量(平均211 ng),显著优于DNeasy PowerSoil Pro试剂盒(117.17 ng)、DNeasy Blood & Tissue试剂盒(122.62 ng)和CTAB法(37.69 ng)。由于革兰氏阳性菌(G
+)细胞壁结构更为复杂,不同提取方法对其效率存在差异。与理论比值2.55相比,所有方法均低估G
+菌相对丰度,其中DNeasy PowerWater试剂盒的G
+/G
?比值(1.58)最接近理论值,表明其提取偏差相对较小;而DNeasy PowerSoil Pro试剂盒(0.46)、DNeasy Blood & Tissue试剂盒(0.34)和CTAB法(0.29)对G
+菌的代表性明显不足。重复性方面,4种提取方法均显示良好重复性,DNeasy PowerSoil Pro试剂盒最佳(中位变异系数CV=0.062),其次为DNeasy PowerWater试剂盒(中位CV=0.075),CTAB法重复性最差(中位CV=0.142)。
**测序平台及其对应文库试剂盒的影响**
为独立评价测序平台及其对应文库试剂盒的影响,研究选用DNA提取效率最高的DNeasy PowerWater试剂盒和跨平台兼容的Kraken2-Bracken分类流程进行标准化分析。物种水平上,Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒表现最佳,精确率0.68、召回率0.79、F1-score 0.73;ONT PromethION 48结合Ligation Sequencing Kit 1D具有可比的召回率(0.77)和F1-score(0.66),但精确率较低(0.58);而MGISEQ-2000结合TruePrep Flexible DNA文库制备试剂盒表现显著较差,精确率0.33、召回率0.36、F1-score仅0.34。属水平上,Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒再次表现最优,精确率0.98、召回率0.92、F1-score 0.95;ONT平台表现接近;MGISEQ-2000平台则显著落后。相对定量方面,Illumina和ONT平台在物种和属水平上均保持较低的假阳性相对丰度和较高的相似度指数,而MGISEQ-2000平台表现较差。重复性评估显示,ONT PromethION 48结合Ligation Sequencing Kit 1D稳定性最高(中位CV=0.065),Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒次之(中位CV=0.079),MGISEQ-2000结合TruePrep Flexible DNA文库制备试剂盒重复性最差(中位CV=0.202)。
**分类分类器的影响**
为独立评价分类分类器的影响,研究固定最优DNA提取方法(DNeasy PowerWater试剂盒)和最优测序平台(Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒)。无阈值优化时,MetaPhlAn4在物种水平基线性能最高;优化阈值后,Kraken2-Bracken性能显著提升并超越其他分类器。物种水平上,Kraken2-Bracken取得最高精确率(0.68)和F1-score(0.73),召回率0.79;MetaPhlAn4精确率略低(0.61),但召回率最高(0.81),F1-score 0.70;Kaiju整体表现较差,精确率仅0.40,F1-score 0.52。属水平上,MetaPhlAn4实现完美精确率(1.00)和优秀F1-score(0.85),但召回率相对较低(0.73);Kraken2-Bracken表现强劲,精确率0.98、召回率0.92、F1-score 0.95;Kaiju表现较弱。相对定量方面,物种水平上MetaPhlAn4具有最低假阳性相对丰度(0.12)和最高相似度(0.25);属水平上Kraken2-Bracken和MetaPhlAn4均保持低假阳性相对丰度。未分类相对丰度分析显示,MetaPhlAn4存在明显平台依赖性,MGISEQ-2000数据未分类比例高达76.92%,而Illumina数据为0%;Kaiju在Illumina和MGISEQ-2000平台上未分类比例分别为10.71%和27.07%;Kraken2-Bracken在所有数据集中均实现0%未分类丰度。运行速度方面,Kraken2-Bracken最快(每样本不足5分钟),显著优于MetaPhlAn4(13.36分钟)和Kaiju(14.12分钟)。重复性方面,Kraken2-Bracken和Kaiju优于MetaPhlAn4。
**不同工作流程的综合性能**
物种水平上,W08(PowerSoil-Illumina-Kraken2-Bracken)和W14(PowerSoil-ONT-Kraken2-Bracken)表现最优,F1-score分别为0.77和0.74。属水平上,W01(PowerWater-Illumina-Kraken2-Bracken)和W08表现最佳,F1-score分别为0.95和0.92。相对定量方面,Bray-Curtis距离评估显示,物种水平上W23(CTAB-Illumina-MetaPhlAn4)和W16(Blood & Tissue-Illumina-MetaPhlAn4)定量准确性最高(距离0.74);属水平上W23表现最优(距离0.58)。此外,针对ONT数据使用Melon进行补充分析,其性能显著低于Kraken2-Bracken。针对高度同源物种(大肠埃希菌和福氏志贺菌)的分析显示,大多数工作流程高估了两者的丰度比值,仅有14.3%的工作流程保持在可接受的两倍区间内,表明当前宏基因组工作流程对近缘物种的区分能力有限。
**最佳实践与讨论**
综合F1-score和相似度指数,DNeasy PowerWater试剂盒或DNeasy PowerSoil Pro试剂盒、Illumina NovaSeq 6000结合TrueLib mRNA文库制备试剂盒、以及Kraken2-Bracken分类器的组合实现了最佳整体性能。讨论部分指出,DNA提取方法对微生物回收效率影响深远,DNeasy PowerWater试剂盒因采用更细密的磁珠和更强效的裂解化学体系,能更有效地破坏难裂解细胞。测序平台方面,MGISEQ-2000表现不佳可能归因于其低起始量转座酶建库方式引入的序列依赖性插入偏好;而ONT平台虽表现接近Illumina,但其长读长测序在高质量基因组组装、复杂基因组区域解析和实时便携式测序方面具有额外优势。分类器性能存在显著变异,相对丰度阈值选择对分类性能影响重大;Kraken2-Bracken基于k-mer的策略强制近乎完全的读段分配,虽降低未分类率但可能增加过度自信分类的风险;Kaiju的蛋白水平比对策略更易受保守蛋白域虚假匹配的影响。高同源物种的存在进一步影响了分类准确性。尽管使用了明确组成的模拟群落,理论值与观测值之间仍存在偏差,可能源于污染、参考基因组与目标菌株的基因组分歧以及高未分类读段比例等因素。研究强调,优化与任意工作流程选择之间的差异显著,最佳组合F1-score超过0.90,而最差组合低于0.40,表明工作流程预评价对确保可靠结果不可或缺。研究局限性包括模拟样本无法完全重现天然海水的复杂性,以及未涉及样本浓缩策略、质量控制框架和海洋特异性数据库选择等因素。该研究建立了沿海海水宏基因组测序工作流程的系统基准,为选择稳健工作流程、提升海洋mNGS研究的可靠性、准确性和可比性提供了指导。