编辑推荐:
研究人员为解决 NCBI 数据库高质量沙门氏菌基因组短缺问题,开展测序研究,贡献 217 个完整基因组,提升分析准确性。
在食品安全领域,全基因组测序(Whole Genome Sequencing,WGS)是检测、调查和控制食源性细菌病原体的重要手段。美国食品药品监督管理局(FDA)的 GenomeTrakr 网络利用 WGS 进行食源性病原体鉴定,并将数据提交到美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的病原体检测(Pathogen Detection,PD)数据库,用于食源性病原体监测和疫情爆发检测。然而,目前 NCBI PD 数据库中 Illumina 短读长测序数据占据主导,这些数据在重复区域、结构变异、移动遗传元件以及某些重要基因(如抗菌素耐药基因和毒力基因)的基因组定位等方面存在信息缺失。同时,数据库中高质量的完整基因组数量较少,仅有约 500 个封闭基因组,这对于深入研究食源性疾病的爆发源头、传播途径以及病原体的遗传特性极为不利。
为了解决这些问题,美国食品药品监督管理局和美国农业部的研究人员 Yan Luo、Jae Hee Jang、Maria Balkey 和 Maria Hoffmann 开展了相关研究。他们的研究成果发表在《BMC Genomic Data》杂志上,为沙门氏菌的研究和食源性疾病的防控提供了重要的数据支持。
研究人员在 2018 - 2021 年期间,利用 PacBio 技术对多种来源的沙门氏菌进行了测序和基因组封闭工作。他们精心挑选了 217 株沙门氏菌,这些菌株来自不同的食品、临床和环境样本,每一株都代表了 NCBI SNP 簇中的一个独特菌株或未聚类的独特分离株。
研究中主要采用了以下关键技术方法:首先,对每株分离菌在 Luria - Bertani(LB)培养基中 35℃培养过夜,提取 DNA;接着,使用 SMRTbell Template Prep Kit 1.0 生成测序文库,并在 Pacific Biosciences(PacBio)Sequel 平台上进行测序;然后,利用 PacBio Hierarchical Genome Assembly Process(HGAP)4.0 对 PacBio 原始读数进行从头组装,再用 Circlator 将组装的基因组环化;如果有对应的 Illumina 短读长数据,使用 Pilon 进行进一步优化;若没有,则用 PacBio 原始读数在 PacBio SMRTLink 的 Resequencing 模块中进行优化。
研究结果如下:
- 高质量基因组数据贡献:研究人员成功获得了 217 个封闭的环形沙门氏菌(Salmonella enterica)基因组,并将其存入 NCBI 的 PD 数据库和 GenBank。这些基因组来自 78 个不同的沙门氏菌血清型,显著丰富了参考基因组数据库的多样性。
- 提升分析准确性:高质量的完整参考基因组有助于更准确地识别沙门氏菌的特定片段,提高系统发育分析、SNP 注释和其他相关分析的准确性。这将使得在食源性疾病爆发时,能够更精确地追踪源头、确定污染途径,并了解毒力和耐药性相关的遗传因素。
在研究结论和讨论部分,这些高质量的完整基因组为沙门氏菌的监测和研究提供了更丰富、准确的数据资源。通过对这些基因组的分析,可以更深入地了解沙门氏菌的遗传特征和进化关系,为食源性疾病的防控提供有力支持。例如,在疫情爆发时,基于这些完整基因组的分析能够快速确定病原体的来源和传播路径,从而采取更有效的针对性干预措施,保障食品安全和公众健康。此外,这些数据还有助于推动比较基因组学等相关领域的研究,进一步揭示沙门氏菌的致病机制和耐药机制,为开发新的诊断方法、治疗策略和预防措施奠定基础。
总体而言,该研究成果对于提升沙门氏菌研究水平、加强食源性疾病防控具有重要的意义,为相关领域的研究和实践提供了宝贵的数据和理论支持。