基于全基因组机器学习的非伤寒沙门氏菌耐药性预测研究

【字体: 时间:2025年07月18日 来源:International Journal of Antimicrobial Agents 4.9

编辑推荐:

  本研究针对沙门氏菌(Salmonella)抗生素耐药性(AMR)检测耗时长、可重复性差等问题,利用全基因组测序(WGS)数据,结合卷积神经网络(CNN)和XGBoost算法构建预测模型,通过SHAP值解析耐药基因贡献度。研究为东南亚地区AMR监测提供新方法,发表于《International Journal of Antimicrobial Agents》,对指导临床用药和耐药防控具有重要意义。

  

在21世纪公共卫生领域,细菌抗生素耐药性(AMR)已成为全球健康的首要威胁之一。据预测,到2050年耐药感染将导致全球每年1000万人死亡,其中南亚和撒哈拉以南非洲地区受影响最为严重。作为世界上最致命的食源性疾病,沙门氏菌(Salmonella)每年造成约9400万病例和15.5万死亡,其耐药性问题若得不到控制,将对人类健康造成更大危害。传统的药敏试验方法——最低抑菌浓度(MIC)测定存在耗时长(通常需要数天培养)、可重复性差等局限,难以满足临床快速检测需求。

香港理工大学的研究团队针对这一难题,开展了基于全基因组测序(WGS)的机器学习预测研究。该研究收集了2018-2023年间来自香港及东盟十国的788株沙门氏菌分离株,利用美国国家生物技术信息中心(NCBI)病原体检测数据库的基因组数据,创新性地将卷积神经网络(CNN)和极端梯度提升(XGBoost)算法应用于AMR预测,并通过博弈论的SHAP值(SHapley Additive exPlanations)方法解析模型决策过程。相关成果发表在《International Journal of Antimicrobial Agents》期刊。

研究采用三大关键技术:1)从NCBI病原体检测数据库获取东南亚地区沙门氏菌WGS数据;2)运用CNN和XGBoost构建AMR预测模型;3)采用SHAP值进行特征重要性分析。其中CNN擅长捕捉基因组序列的局部特征模式,XGBoost则在处理结构化特征时表现出色,两者优势互补。

研究结果部分:

【分布特征】样本主要来自印度尼西亚(220株)、柬埔寨(158株)和越南(90株),香港地区98株分离株来自三级医院临床样本。

【模型性能】CNN和XGBoost模型在预测多种抗生素耐药性时均表现出高准确度,其中对β-内酰胺类药物的预测性能尤为突出。

【SHAP解析】通过特征重要性分析发现,blaTEM、qnrS等耐药基因对预测贡献度最高,与已知表型耐药谱高度吻合。

讨论部分指出,香港作为食品进口率超90%的国际都市,是研究沙门氏菌全球传播的理想窗口。研究首次系统揭示了东南亚地区沙门氏菌耐药基因的流行特征,模型解释性分析为理解耐药机制提供了新视角。结论强调,该机器学习框架不仅可用于现有耐药性监测,还能预警新型耐药突变,为AMR管控和抗生素研发提供决策支持。研究获得美国-东盟科技合作计划(STIC)种子基金和香港理工大学启动基金资助。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号