
-
生物通官微
陪你抓住生命科技
跳动的脉搏
真菌多样性代谢条形码技术评估:基于多定义模拟群落与不同分类方法的ITS1和ITS2 Illumina测序分析
【字体: 大 中 小 】 时间:2025年08月07日 来源:BMC Genomics 3.7
编辑推荐:
本研究针对真菌多样性分析中ITS1和ITS2代谢条形码技术的准确性难题,通过构建37个定义模拟群落(DMCs),系统评估了测序区域(ITS1/ITS2)、参考数据库(UNITE/BCCM/IHEM)、生物信息学工具(BLAST/mothur)和分类水平(种/属)对分类性能的影响。研究发现Illumina测序在属水平分类表现优异(精度>85.9%),但种水平分类受限于ITS区域鉴别力(56-100%准确率),其中ITS2精度更优,BLAST结合IHEM数据库在专家审核下可实现最佳性能。该研究为环境样本真菌鉴定提供了方法学选择依据,发表于《BMC Genomics》。
真菌作为生态系统中有机物分解和营养循环的关键参与者,其多样性研究对人类健康、农业和医药领域具有重要意义。然而,复杂环境样本中真菌物种的准确鉴定一直面临挑战——虽然内部转录间隔区(ITS)被确立为真菌标准条形码,但短读长测序技术(如Illumina)只能靶向ITS1或ITS2子区域,且不同分类方法和数据库的选择会显著影响结果可靠性。更棘手的是,某些常见属(如曲霉属Aspergillus、青霉属Penicillium)的种间ITS序列差异微小,导致传统方法难以精准鉴别。
比利时Sciensano研究所的研究团队通过构建37个人工定义模拟群落(DMCs),涵盖子囊菌门(Ascomycota)、担子菌门(Basidiomycota)和毛霉门(Mucoromycota)的51个物种,首次系统比较了ITS1与ITS2在Illumina平台上的分类性能。研究采用双数据库(UNITE v8.2与自建IHEM数据库)和双算法(BLAST与mothur),通过Sanger测序建立基准值后发现:Illumina测序虽保持相似召回率(recall),但精度(precision)普遍降低;属水平分类稳定可靠(F1值>95%),而种水平表现高度可变(56-100%);ITS2区域展现出比ITS1更高的鉴别特异性,定制化IHEM数据库因注释完整度优势显著优于通用UNITE库。该成果为环境微生物组研究提供了关键方法学指导。
关键技术方法包括:(1)构建含51个室内环境常见真菌的37个DMCs;(2)采用ITS1catta/ITS2ngs和gITS7ngs/ITS4ngsUni引物对分别扩增ITS1/ITS2区域;(3)Illumina MiSeq平台250-bp双端测序;(4)基于Snakemake的标准化分析流程整合Trimmomatic质控、mother聚类和BLAST/ITSx分类;(5)通过精度、召回率和L1距离等指标量化性能。
主要结果
Sanger测序基准测试
使用全长ITS序列模拟DMCs时,IHEM-BLAST-LOOSE组合达到99.3%精度和95.1%召回率,但严格模式下召回率骤降至57.8%,揭示多等效BLAST命中是主要误差源。属水平分类稳定性显著优于种水平(平均F1提升23%)。
Illumina测序性能
ITS2区域在种水平平均精度(98.5%)高于ITS1(90.6%),但二者召回率相当(约95%)。技术重复实验显示仅0.37%低丰度OTUs存在分类波动,证实实验可重复性。
数据库影响
IHEM数据库因完整物种注释和较小规模,其F1值普遍比UNITE高15-20%。UNITE库中43,716条未注释物种序列导致mother-WANG方法产生大量未分类OTUs。
亚属级分类补救
通过人工核查系列(section)和种复合体(species complex)信息,成功将13-14个种水平误判案例修正至正确分类阶元,如烟曲霉(Aspergillus fumigatus)和产黄青霉(Penicillium chrysogenum)可准确归类至相应节/系列。
丰度估计局限性
尽管DMCs中各物种DNA等量混合,Illumina读长计数推算的丰度与理论值偏差显著(L1距离0.4-1.2),显示ITS拷贝数变异和PCR偏好性严重影响定量准确性。
这项研究确立了真菌代谢条形码分析的最佳实践框架:对于属水平普查,ITS2+mothur-WANG+IHEM组合可实现自动化高效分析;而种水平鉴定需结合ITS1/ITS2双区域数据和BLAST-LOOSE人工复核。值得注意的是,约20%的物种仍需依赖亚属级分类信息辅助判断,这凸显了建立包含节/系列信息的标准化数据库的紧迫性。该成果不仅为室内环境真菌监测提供了方法学规范,其构建的DMCs和评估体系还可作为未来测序技术(如纳米孔长读长测序)的基准测试平台。随着真菌分类学研究的深入,整合多基因标记(TEF1α、RPB2)可能成为突破当前ITS鉴别瓶颈的新方向。
生物通微信公众号
知名企业招聘