基于机器学习筛选最小特征集的金黄色葡萄球菌抗生素敏感性预测模型:宏基因组测序驱动的可解释性规则方法

【字体: 时间:2025年07月12日 来源:Microbiology Spectrum 3.7

编辑推荐:

  这篇研究通过机器学习筛选金黄色葡萄球菌(Staphylococcus aureus)抗生素耐药性(AMR)的最小基因组特征,建立了高精度规则化预测模型。研究分析了4,796株菌株的18种抗生素数据,发现1-5个关键耐药基因(含2个新型万古霉素标记),在分离株测试中达到AUC 0.94-1.00、灵敏度97.43%、特异度99.02%。经宏基因组测序(mNGS)优化后,59例临床样本预测准确率达81.82%-100%,平均缩短诊断时间39.9小时,为临床耐药性管理提供了可解释的快速检测方案。

  

ABSTRACT
抗菌素耐药性(AMR)已成为全球健康重大挑战,金黄色葡萄球菌作为多重耐药病原体代表,其快速准确的药敏检测(AST)对临床决策至关重要。传统培养法需48-72小时,而全基因组测序(WGS)模型存在过拟合和可解释性差等问题。本研究通过分析4,796株金黄色葡萄球菌基因组,筛选出18种抗生素的1-5个关键耐药基因(包括两个新型万古霉素标记SA_VAN_var_M1和SA_VAN_gpa_M1),构建的规则化预测模型在分离株测试中达到97.43%灵敏度和99.02%特异度。经宏基因组测序(mNGS)优化后,临床样本预测准确率提升至81.82%-100%,较培养法平均缩短39.9小时诊断时间。

IMPORTANCE
该研究首次将机器学习特征筛选与规则化模型相结合,解决了mNGS数据浅覆盖下的AMR预测难题。特别发现mecA基因对头孢西丁耐药的决定性作用(AUC从0.5提升至0.98),修正了CARD数据库的原有注释。

INTRODUCTION
耐甲氧西林金黄色葡萄球菌(MRSA)和万古霉素耐药菌株(VRSA)的流行导致治疗成本激增。研究团队通过构建GenseqResDB数据库整合CARD和ORF策略,采用LASSO回归筛选特征,显著提升模型稳定性——样本量达到1,000株后性能趋于饱和。

MATERIALS AND METHODS
从BV-BRC等数据库获取菌株后,采用严格质控标准(N50>5kb,ANI>0.95)。通过GeneMarkS预测基因,CD-HIT聚类核心基因构建系统发育树。特征选择采用CARD数据库比对和ORF筛查双策略,LASSO回归筛选出18种抗生素的21个关键标记,如庆大霉素的AAC(6')-Ie-APH(2'')-Ia基因(PPV 0.968)。

RESULTS

  1. 关键耐药标记发现
  • 万古霉素:除vanA外,新发现SRPBCC结构域蛋白基因(PPV 0.978)和DegV结构域蛋白(PPV 0.804)
  • 头孢西丁:mecA基因决定作用(原CARD仅注释其对甲氧西林耐药)
  • 氟喹诺酮类:gyrA基因251位点C->T突变
  1. mNGS优化性能
  • 短读长(50bp)下ARG亚型识别准确率>90%
  • 测序深度阈值:基因型模型需0.2×,突变检测需3×
  • 临床验证59例样本中,头孢西丁预测准确率96%(25/26),万古霉素达100%

DISCUSSION
相比传统ResFinder方法,本研究通过最小特征集策略将头孢西丁预测AUC从0.5提升至0.98。临床应用中需注意:

  1. 测序深度<0.2×时需谨慎报告阴性结果
  2. 混合样本中耐药基因可能来自共生菌
  3. 模型对氟喹诺酮类突变检测特异性达95.83%

创新性在于:

  • 建立首个适用于mNGS的金黄色葡萄球菌规则化AST模型
  • 发现mecA对β-内酰胺类的交叉耐药机制
  • 临床转化价值:较培养法缩短40小时,满足脓毒症等急症需求

局限性包括样本量较小(59例)且为回顾性研究,未来需扩大前瞻性验证。该技术为AMR管理提供了兼具速度和精度的"第三代"检测方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号