
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习筛选最小特征集的金黄色葡萄球菌抗生素敏感性预测模型:宏基因组测序驱动的可解释性规则方法
【字体: 大 中 小 】 时间:2025年07月12日 来源:Microbiology Spectrum 3.7
编辑推荐:
这篇研究通过机器学习筛选金黄色葡萄球菌(Staphylococcus aureus)抗生素耐药性(AMR)的最小基因组特征,建立了高精度规则化预测模型。研究分析了4,796株菌株的18种抗生素数据,发现1-5个关键耐药基因(含2个新型万古霉素标记),在分离株测试中达到AUC 0.94-1.00、灵敏度97.43%、特异度99.02%。经宏基因组测序(mNGS)优化后,59例临床样本预测准确率达81.82%-100%,平均缩短诊断时间39.9小时,为临床耐药性管理提供了可解释的快速检测方案。
ABSTRACT
抗菌素耐药性(AMR)已成为全球健康重大挑战,金黄色葡萄球菌作为多重耐药病原体代表,其快速准确的药敏检测(AST)对临床决策至关重要。传统培养法需48-72小时,而全基因组测序(WGS)模型存在过拟合和可解释性差等问题。本研究通过分析4,796株金黄色葡萄球菌基因组,筛选出18种抗生素的1-5个关键耐药基因(包括两个新型万古霉素标记SA_VAN_var_M1和SA_VAN_gpa_M1),构建的规则化预测模型在分离株测试中达到97.43%灵敏度和99.02%特异度。经宏基因组测序(mNGS)优化后,临床样本预测准确率提升至81.82%-100%,较培养法平均缩短39.9小时诊断时间。
IMPORTANCE
该研究首次将机器学习特征筛选与规则化模型相结合,解决了mNGS数据浅覆盖下的AMR预测难题。特别发现mecA基因对头孢西丁耐药的决定性作用(AUC从0.5提升至0.98),修正了CARD数据库的原有注释。
INTRODUCTION
耐甲氧西林金黄色葡萄球菌(MRSA)和万古霉素耐药菌株(VRSA)的流行导致治疗成本激增。研究团队通过构建GenseqResDB数据库整合CARD和ORF策略,采用LASSO回归筛选特征,显著提升模型稳定性——样本量达到1,000株后性能趋于饱和。
MATERIALS AND METHODS
从BV-BRC等数据库获取菌株后,采用严格质控标准(N50>5kb,ANI>0.95)。通过GeneMarkS预测基因,CD-HIT聚类核心基因构建系统发育树。特征选择采用CARD数据库比对和ORF筛查双策略,LASSO回归筛选出18种抗生素的21个关键标记,如庆大霉素的AAC(6')-Ie-APH(2'')-Ia基因(PPV 0.968)。
RESULTS
DISCUSSION
相比传统ResFinder方法,本研究通过最小特征集策略将头孢西丁预测AUC从0.5提升至0.98。临床应用中需注意:
创新性在于:
局限性包括样本量较小(59例)且为回顾性研究,未来需扩大前瞻性验证。该技术为AMR管理提供了兼具速度和精度的"第三代"检测方案。
生物通微信公众号
知名企业招聘