
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可解释机器学习的铜绿假单胞菌抗生素耐药性预测新策略
【字体: 大 中 小 】 时间:2025年08月23日 来源:Bioinformatics Advances 2.8
编辑推荐:
本研究针对铜绿假单胞菌(P. aeruginosa)耐药性检测耗时、传统分子诊断特异性不足等问题,开发了基于k-mer特征的双层可解释机器学习预测框架。通过分析13-mer基因组特征,决策树模型在Tier-I实现79%准确率(AUC-ROC 0.77),Tier-II对13种抗生素的耐药预测准确率达71-98%。SHAP分析揭示了关键k-mer标记物,为临床快速检测提供了新思路。
铜绿假单胞菌这个狡猾的"医院杀手"近年来让全球医生头疼不已。作为世界卫生组织(WHO)重点监控的"高优先级病原体",它不仅能引发肺炎、尿路感染等多种医院获得性感染,更可怕的是其日益增长的抗生素耐药性(AMR)。传统药敏试验(AST)需要2-3天才能出结果,而PCR等分子检测又存在特异性不足的缺陷。面对这种困境,来自德里大学的研究团队在《Bioinformatics Advances》发表了一项突破性研究,开发出基于机器学习的双层次预测系统,仅需基因组序列就能快速准确地预测耐药性。
研究团队采用PATRIC数据库中实验室确认的732株耐药和372株敏感菌株,通过GenomeTester4生成3-28bp的k-mer特征。采用卡方检验筛选显著关联k-mer后,比较了支持向量机(SVM)、逻辑回归(LR)和决策树(DT)三种算法。最终13-mer决策树模型在Tier-I(耐药/敏感判断)获得84%灵敏度和70%特异性;在Tier-II(特定抗生素耐药预测)对碳青霉烯类的亚胺培南(Imipenem)预测准确率高达98%。通过SHAP可解释性分析,发现如亚胺培南耐药相关的"CCCGTTTAAAGAG"等关键k-mer标记。
Tier-I预测
决策树模型使用1000个显著13-mer特征,在独立测试集实现79%准确率(AUC-ROC 0.77)。值得注意的是,k-mer"ACGTCGCGCCCCG"的富集与敏感表型强相关,而"GAAATCCAGATCC"则显著关联耐药性。
Tier-II预测
针对13种抗生素建立的专项模型中,碳青霉烯类表现最优:亚胺培南(98%)、多尼培南(95%)和美罗培南(86%)。氨基糖苷类的妥布霉素(93%)和庆大霉素(91%)预测效果同样出色。SHAP分析揭示抗生素特异性标记,如环丙沙星耐药的"GCAACAACGTGGA"缺失模式。
模型验证
使用NCBI AMRFinderPlus的56株独立菌株验证,Tier-I准确率达98%,成功识别全部47株耐药菌株。
这项研究的创新性在于将机器学习预测与生物标志物发现相结合。通过k-mer分析不仅规避了传统方法对已知耐药基因的依赖,SHAP解释更为发现新的耐药机制提供了线索。研究揭示的多个非经典耐药相关k-mer(如映射到重金属代谢基因的序列),暗示了环境压力可能通过非直接途径影响耐药性。该框架的通用性使其可扩展至其他病原体,为临床耐药性快速筛查提供了新范式。随着测序成本降低,这种"序列输入-结果输出"的预测模式有望成为传统药敏试验的重要补充。
生物通微信公众号
知名企业招聘