用于可靠检测和分型携带mcr、erm、mph和lnu抗生素抗性基因的短读长序列的ROcker模型

《Microbiology Spectrum》:ROCker models for reliable detection and typing of short-read sequences carrying mcr, erm, mph, and lnu antibiotic resistance genes

【字体: 时间:2025年10月28日 来源:Microbiology Spectrum 3.8

编辑推荐:

  抗生素耐药基因(ARGs)的定量监测是当前公共卫生监测的重要挑战。本研究开发了针对mcr、mph、erm和lnu四大ARG家族的九种ROCker新型生物信息学模型,通过动态阈值优化基因分类。实验表明,在250bp短读数据中,ROCker模型F1分数比传统方法(BLASTx、HMM)高31%,假阳性率降低30%,假阴性率降低16%。模型显著提升了短读测序中ARGs的检测精度,解决了非目标蛋白共享功能域导致的误判问题,为环境样本和临床样本的耐药基因监测提供了高效工具。

  在当今全球范围内,抗生素耐药性已成为影响人类和动物健康的重要问题。据报告,仅在美国,每年就有超过280万例抗生素耐药性感染,导致超过3.5万人死亡。抗生素耐药性基因(ARGs)的检测和监控对于评估公共卫生风险至关重要。然而,传统的ARGs检测方法在处理短读长序列数据时面临诸多挑战。短读长序列在未组装的情况下,无法直接通过基因预测或注释来识别特定的耐药性基因,这限制了其在复杂微生物群落中的应用。因此,开发一种能够高效、准确地检测和分类这些基因的新方法变得尤为迫切。

本文介绍了一种名为ROCker的新型生物信息学工具,旨在解决短读长序列中ARGs检测的问题。ROCker模型通过动态调整位点特异性位分值(bit score)阈值,显著提高了检测的准确性,同时降低了假阳性率和假阴性率。这种模型特别适用于mcr、mph、erm和lnu等ARGs家族及其特定变体,如mcr-1、mphA、ermB、lnuF、lnuB和lnuG。通过结合最新的ROCker V2流程,研究团队构建了九个ROCker模型,并对其进行了广泛的测试和验证。这些模型不仅提升了ARGs的检测性能,还为未组装的短读长序列提供了更可靠的分类和量化手段。

在实际应用中,ROCker模型能够处理多种数据类型,包括宏基因组、宏转录组以及PCR扩增子数据。这些数据通常来自于不同的环境或临床样本,而传统的静态过滤方法(如BLASTx和隐马尔可夫模型)在处理这类数据时往往存在较大的不确定性,导致假阳性或假阴性结果的频率较高。相比之下,ROCker模型通过动态阈值调整,能够在不同读长下保持较高的检测一致性,从而提供更精确的基因功能识别。

为了验证ROCker模型的有效性,研究团队利用模拟数据集对模型进行了评估。这些数据集来源于携带ARGs的完整基因组序列,并且覆盖了多种常见的读长(100、150、250和300碱基对)。通过将这些模拟数据集与ROCker模型进行比较,结果显示ROCker模型在250碱基对读长下,假阳性率降低了30%,假阴性率降低了16%,并且F1评分提高了10倍以上。这些结果表明,ROCker模型在识别和分类短读长序列中的ARGs方面具有显著优势。

此外,研究团队还注意到,不同ARGs家族在检测过程中表现出不同的挑战。例如,mcr基因家族与eptA基因存在较高的序列相似性,这使得在未组装的短读长数据中难以区分两者。因此,在构建ROCker模型时,必须考虑这些潜在的干扰因素,并通过精心选择的正向和负向参考序列来提高模型的鲁棒性。同样,mph、erm和lnu基因家族的检测也面临类似的挑战,但ROCker模型在这些基因家族中的表现同样优异。

为了进一步提升ROCker模型的性能,研究团队引入了新的自动化流程,包括ROCkIn和ROCkOut模块。ROCkIn用于获取和筛选参考序列,而ROCkOut则用于构建、优化和测试模型。这一流程不仅提高了模型开发的效率,还减少了人为错误的可能性。通过使用这些模块,研究团队能够快速生成高质量的模型,并确保其在不同数据集中的适用性。

在实际测试中,ROCker模型被应用于真实的短读长数据集,以评估其在真实环境中的表现。结果表明,模型在实际数据中的假阳性率和假阴性率均低于模拟数据集,这可能是因为真实数据中包含的序列错误和偏差较少。此外,研究团队还发现,一些在模拟数据中被误判为假阴性的读长,在真实数据中却能够被正确识别。这说明ROCker模型在处理真实数据时具有更高的鲁棒性和准确性。

总的来说,ROCker模型为抗生素耐药性基因的检测和监控提供了一种新的解决方案。通过动态调整位点特异性位分值阈值,ROCker能够在复杂的数据环境中更准确地识别ARGs,并显著减少误判的可能性。这一工具不仅适用于宏基因组和宏转录组数据,还能够有效处理PCR扩增子数据,为公共卫生监测和环境研究提供了强有力的支持。随着技术的不断进步,ROCker模型的应用前景将更加广阔,有助于更全面地理解抗生素耐药性的传播和演化过程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号