全球多实验室研究揭示DNA参考试剂在消除微生物组分析偏差中的关键作用
《mSystems》:DNA reference reagents isolate biases in microbiome profiling: a global multi-lab study
【字体:
大
中
小
】
时间:2025年10月18日
来源:mSystems 4.6
编辑推荐:
本综述通过全球23个实验室的联合研究,系统评估了两种明确表征的DNA参考试剂(RRs)在微生物组分析中的应用。研究揭示了宏基因组学(NGS)和16S rRNA基因扩增子测序中存在的技术偏差来源,包括测序深度、引物选择、数据库差异等关键因素。通过建立最小质量标准(MQC),为微生物组数据质量评估提供了标准化框架。该研究为提升微生物组研究的可靠性和可比性提供了重要工具和基准,对推动转化研究和产品开发具有重要意义。
在人类肠道微生物组分析中,分析方法引入的技术偏差阻碍了转化研究,降低了数据可靠性和研究可比性。本研究通过一项涉及23个实验室的全球研究,分析了用于两种明确表征的DNA参考试剂(RRs)分类学分析的广泛测序和生物信息学方法。通过鸟枪法测序和16S rRNA基因扩增子测序,旨在分离偏差来源并了解其对微生物组分析准确性的影响。重要的是,建立了最小质量标准(MQC)并用于评估分析性能。研究发现鸟枪法测序数据集的变异性大于16S rRNA基因扩增子测序,并分离了湿实验室和干实验室步骤中的偏差来源,如测序深度、引物和数据库选择、稀疏化和16S拷贝数调整。本研究提出了明确表征的RRs和MQC来对抗技术偏差,为可靠和可比的微生物组研究铺平了道路。
这篇基准论文强调了全球范围内微生物组数据的真实变异性水平,强调了使用WHO国际DNA肠道参考试剂(RRs)以提高微生物组研究数据质量的关键需求。这项全球研究是同类研究中的首创,揭示了该领域偏差的现实,全面测试了全球领先实验室使用的方法,并为工作流程优化提供了途径,以加速创新和转化研究,推动该领域向前发展。
下一代测序(NGS)技术的发展支持了微生物组领域的快速扩张。然而,目前围绕方法学尚无共识,方法学的多样性导致了不一致的数据和最佳实践的不确定性。当使用不同的方法分析相似或相同的样品时,相互矛盾的发现很常见。微生物组研究固有地面临偏差,例如在样品收集、储存、DNA提取、文库制备和测序过程中。这导致微生物组样品组成的报告不准确。为了解决偏差并改进结果,文献报告和思想领袖呼吁标准化NGS协议以帮助转化研究和产品开发。
为了微生物组研究的可靠比较和可重复性,一个明确表征的参考试剂作为全球参考点充当基本事实至关重要。为测序和数据分析(下游)开发这种材料将确保高质量数据,并允许在工作流程的早期步骤(上游)中准确识别偏差。虽然商业微生物组标准存在,并且可以使用参考生物样品(例如,粪便浆液),但我们之前已经表明不同的参考试剂(RRs)有局限性。已经做出了社区努力以使用类似方法解决这些偏差,揭示了过程每一步的变异性。本研究的不同之处在于它更进一步,提供了由社区验证的世界卫生组织(WHO)国际参考试剂,可用于进一步扩展本研究的发现,标准化当前方法并确保全球数据的可交换性。通过采用明确的基本事实,结合包含测序和生物信息学分析并隔离外部因素的过程的分步方法学,该策略为评估每个阶段的变异提供了系统框架。因此,必须拥有特定目的的试剂,试图模拟目标样品的复杂性,以揭示偏差,确保所使用的方法提供有意义的结果。最终,只要不同的研究使用不同的标准,就无法实现全球数据协调,因此WHO国际参考试剂作为该全球参考点,确保研究之间的可重复性和可比性,以及主要校准品。
WHO国际参考试剂是主要标准,有时称为“黄金”标准,它们作为全球单一主要参考试剂的使用促进了研究结果的可比性。对具有官方WHO地位的参考试剂的需求通常是由于监管和科学活动而确定的。
药品和保健产品监管局(MHRA)的微生物组小组开发了DNA-Gut-Mix(NIBSC 20/302)和DNA-Gut-HiLo(NIBSC 20/304)参考试剂,用于通过NGS进行肠道微生物组分析。这些材料模拟人类肠道微生物组,并允许研究人员挑战流程的灵敏度和特异性(将单个读段归因于正确生物体的能力)。进行了一项WHO国际协作研究,以使用各种NGS技术评估这些参考材料,确保来自学术机构、政府机构、服务提供商和制药行业的代表性。如参考文献中所述的报告系统,用于设定最小质量标准(MQC)以指导宏基因组数据的质量评估。这些RRs已经由WHO生物标准化专家委员会(ECBS)评估,并已被确立为第一个用于通过NGS进行肠道微生物组分析的WHO国际参考试剂。这些试剂不以营利为目的,按成本回收 basis 出售,确保全球可及性。
本研究的目的是确定DNA-Gut RRs在揭示微生物组分类学分析中测序和生物信息学引入的变异性和偏差方面的效用,了解全球分析的真实变异性水平,并根据真实数据为用户建立MQC。因此,本研究可以作为评估未来微生物组分析工具随时间演变的分析性能的基准。通过这样做,我们旨在提高全球微生物组数据和技术的质量、可重复性和信任度,最终导致对人类肠道微生物组的更好理解。
为了评估鸟枪法测序数据的变异(图1),评估了两种RRs的四个关键报告指标。在DNA-Gut-Mix RR的19个鸟枪法测序数据集中,灵敏度范围从74%到100%,假阳性相对丰度(FPRA)范围从0%到41%,多样性范围从14到180个物种,相似性范围从34%到87%(表1)。对于DNA-Gut-HiLo RR,灵敏度范围从63%到100%,FPRA范围从0%到13%,多样性范围从12到185个物种,相似性范围从55%到95%(表1)。DNA-Gut-HiLo RR比DNA-Gut-Mix更能挑战参与者方法的分析灵敏度(P值=0.0208),在许多情况下无法识别低丰度物种。
重要的是识别影响观察到的关键报告指标的常见方法学特征(表S2)。19个数据集中有7个满足两种RRs所有报告指标的MQC(实验室8、10、13、15-NS2000、18、22和24;表S2)。六个数据集使用150–151 bp读长,而一个使用300 bp,其中五个使用Nextera接头(四个Nextera Flex和一个Nextera XT),而一个使用NEBNext Multiplex Oligos for Illumina(索引引物组一和二)。实验室13和15使用推荐的生物信息学流程,而实验室8和24采用与推荐类似的方法。值得注意的是,实验室10以每个样品约89万读段达到MQC,远低于其他五个实验室(平均每个样品2540万读段),表明可以在较低读段深度下实现高精度分类学分析。
虽然鸟枪法测序提供更广泛的覆盖范围和更高的微生物组组成分辨率,但16S rRNA基因扩增子测序仍然是低生物量样品或具有高水平污染DNA的样品的经济有效的分析工具。在本研究中,虽然鸟枪法测序允许物种水平分析,但发现与16S rRNA基因扩增子测序数据相比,数据集具有更大的变异系数(图1和2;表S3)。
我们进一步分析这些数据以评估鸟枪法测序数据稀疏化对准确性的影响,因为这通常是整个领域争论的话题。当数据被稀疏化(二次采样到对应于总读段0.005%的深度)时,相似性度量不受影响。稀疏化主要影响多样性度量,DNA-Gut-Mix和DNA-Gut-HiLo RR平均分别减少46%和40%,在一个案例中最多去除142个物种(表S4)。尽管通过减少假阳性提高了特异性,但稀疏化降低了三个数据集的灵敏度度量,突出了先前显示的灵敏度-特异性权衡。通过这些RRs,用户可以决定稀疏化是否适合他们的数据集,证明对于大大高估样品多样性的方法很有价值。
数据库选择显著影响结果。所有三个实验室15数据集未在任一RR中识别Alistipes(使用ChocoPhlAn3),而实验室11和16检测到额外的Collinsella spp.(分别为8个和4个额外物种)不存在于RRs中(表S5),可能错误分类来自Collinsella aerofaciens序列的读段。没有使用MetaPhlAn3数据库(ChocoPhlAn3)生成的数据集识别Ruminococcus gauvreauii,因为该物种在数据库中缺失。报告多样性最大高估的两个数据集,实验室11和16(表1)之间唯一共享的分析方面是数据库选择,即分别是RefSeq(Venti)和RefSeq(Rep 82)。值得注意的是,细菌物种的持续重新分类可能导致过时的数据库、数据库之间的不一致以及随后的不准确分类学分析,使用非策划数据库也可能出现同样的情况。
一致的文库制备和生物信息学方法可以在允许测序方法变异的同时采用,以解耦和精确定位测序中的偏差来源。实验室15使用三种不同的测序平台和深度对RRs进行测序(表S1),并且通过保持生物信息学分析一致,我们能够识别多样性
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号