编辑推荐:
为解决海洋研究中模拟群落缺乏问题,研究人员基于多种海洋微生物的 16S 和 18S rRNA 基因序列构建模拟群落。经验证,其可检测扩增子测序偏差,V9 数据比 V4 偏差小,有助于保障测序准确性与实验室间比对。
扩增子测序或 16S、18S rRNA 基因宏条形码分析被广泛用于评估微生物群落组成,因其成本低且易生成数据,在包括海洋微生物研究的广泛领域中常见。模拟群落是用于方法开发、测试或验证的细胞或 DNA 的确定混合物。本文呈现基于先前使用的多种海洋微生物 16S 和 18S rRNA 基因序列的模拟群落,其作为扩增子测序的对照可检测有偏差或异常的测序运行。
模拟群落是包含质粒、扩增子、基因组 DNA 或完整细胞的确定混合物,提供序列丰度的先验知识。当作为外部对照时,它们帮助评估扩增子测序运行的偏差和准确性。若某一运行在模拟群落中显示出强偏差,该运行的环境序列可能受到质疑,如先前观察到某测序运行完全漏掉一个分类群的情况。若不包含模拟群落,误差可能无法被检测到,导致错误结论。
随着对整合数据集和实验室间协调的兴趣上升,需要模拟群落来确保测序运行具有可接受的偏差。然而,由于缺乏可用性,其在海洋研究中的纳入率较低。Zymo 研究公司有模拟群落可用,但这些不包括海洋微生物,而海洋微生物是海洋研究推荐使用的。
因此,研究人员从基于海洋微生物序列的 DNA 构建了模拟群落,这些模拟群落大致复制了 Parada 等人和 Yeh 等人先前报道的那些,而后者现在已无法获得且无法再重建。所用序列的方法可在 protocols.io 上获取。简而言之,合成质粒以包含代表不同微生物的全长 16S 或 18S 序列。然后对序列进行 PCR 扩增、定量,并以等摩尔或不同比例混合,分别创建均匀和交错的模拟群落。
为进行验证,按照 Rabines 等人的方法,将模拟群落纳入 16S rRNA 基因 V4-V5 区域以及 18S rRNA 基因 V4 和 V9 区域的扩增子测序文库。16S 和 18S-V4 文库在 Illumina NextSeq 2000(2×300 bp)上测序,18S-V9 文库在 Illumina MiSeq(2×150 bp)上测序。然后在 QIIME2 环境中处理样品。简而言之,用 cutadapt 修剪序列,用 DADA2 去噪,并通过 BLAST 将其分配给参考序列。所有均匀模拟群落中的某些分类群偏离了其预期百分比,表明存在潜在偏差。总体而言,交错群落中的分类群除某些例外情况外显示出预期分布。在 18S 群落中,V9 数据的偏差小于 V4 数据,表明两种引物之间存在不同的偏差。
进一步纳入这些模拟群落可促进实验室间比较,并确保测序运行具有可接受的偏差。它们也可能用于评估其他引物组,包括使用长读长测序的全长 16S 和 18S 测序。基于细胞的模拟群落的开发将进一步考虑 DNA 提取过程中的偏差,然而,这些将限于可培养的生物体,并且其自身可能存在偏差。
我们感谢 Jed Fuhrman 博士及其实验室成员,他们先前分享了本文所使用的模拟群落所基于的那些模拟群落。
这项工作得到了美国国家海洋和大气管理局授予 A.E.A 的 NA19NOS4780181 号资助、美国国家科学基金会授予 A.E.A 的 OCE-2224726 号资助,以及西蒙斯基金会微生物生态系统原理合作(PriME)授予 A.E.A 的 970820 号资助。