编辑推荐:
为解决 SAB 高复发率、高死亡率及临床治疗难题,研究人员开展基于机器学习的复发性 SAB 预测模型研究。结果显示 XGBoost 模型预测性能最佳。该研究能助医生诊疗,优化医疗资源分配,值得科研读者一读。
在医学的战场上,金黄色葡萄球菌菌血症(SAB)就像一个狡猾又凶狠的 “敌人”,一直是社区获得性和医院获得性血流感染的重要 “肇事者”。它不仅复发率高,死亡率也不容小觑,给临床治疗带来了重重挑战。尤其是新冠疫情爆发后,SAB 患者数量逐渐增多,耐甲氧西林金黄色葡萄球菌(MRSA)感染的比例也在不断攀升。想象一下,医生们面对这些棘手的患者,就像在迷雾中摸索,急需一盏明灯来指引方向,而建立一个能预测 SAB 复发的模型,就成了那盏至关重要的灯。
正是在这样的背景下,相关研究人员展开了一场与 SAB 的 “较量”。他们的研究成果发表在了《BMC Medical Informatics and Decision Making》期刊上,论文题目为《Machine learning-based prediction model for recurrent Staphylococcus aureus bacteremia》。研究人员通过一系列努力,得出了重要结论:采用 XGBoost 算法构建的预测模型在预测 SAB 复发方面表现出色,能帮助医生及时诊断和治疗患者,这一成果对于优化临床治疗策略、合理分配医疗资源有着重要意义。
为了打赢这场 “战斗”,研究人员采用了多种关键技术方法。他们从重症监护医学信息库 IV(MIMIC-IV)版本 2.2 数据库中获取患者数据,这个数据库就像一个装满医学宝藏的大仓库。接着,利用递归特征消除(RFE)和最小绝对收缩和选择算子(LASSO)这两种方法来挑选出关键特征,就像是从众多矿石中筛选出最有价值的金子。然后,用极端梯度提升(XGBoost)、随机森林(RF)、逻辑回归(LR)、支持向量机(SVM)和人工神经网络(ANN)这些强大的 “武器” 构建预测模型。最后,通过受试者工作特征曲线(ROC)分析、决策曲线分析(DCA)和精确召回曲线(PRC)来对模型进行严格的 “考核”,还利用 SHAP(SHapley Additive exPlanations)值来解释模型,让模型不再神秘。
下面来看看研究人员的 “战绩”,也就是研究结果。
- 患者特征:研究人员仔细对比了 711 名无复发性 SAB 患者和 101 名复发性 SAB 患者。发现两组患者在基线特征和病史方面没有显著差异,但在一些关键指标上却有大不同。比如,住院期间接受瓣膜置换手术和血液透析的患者,再次因 SAB 入院的可能性更大;血常规中的红细胞(RBC)、红细胞分布宽度(RDW)等指标,以及生化检查中的白蛋白、钙、钠等指标,两组间差异明显;凝血相关指标国际标准化比值(INR)、凝血酶原时间(PT)、部分凝血活酶时间(PTT)差异显著;病原体、万古霉素使用时长和浓度,还有一些计算得出的指标,如中性粒细胞与淋巴细胞比值(NLR)、预后营养指数(PNI)等,对于识别再入院高风险患者也很关键。
- 模型比较:研究人员用五款 “武器” 构建的模型进行了一场激烈的 “比拼”。从受试者工作特征曲线(ROC)的结果来看,XGBoost 模型的曲线下面积(AUC)值为 0.76(95% 置信区间:0.66 - 0.85),表现最佳;决策曲线分析(DCA)显示,XGBoost 模型在不同阈值下的标准化净效益稳定且较高;精确召回曲线中,XGBoost 模型的 PRAUC 值为 0.56(95% 置信区间:0.37 - 0.75),同样拔得头筹。这一系列结果都表明,XGBoost 模型在预测 SAB 复发方面实力超群。
- Shap 值:XGBoost 模型如此厉害,它的内部 “奥秘” 是什么呢?研究人员通过计算 SHAP 值来一探究竟。结果发现,PTT、中性粒细胞绝对值(Neutrophils_abs)、RDW 是影响模型结果的三个关键因素。从 SHAP 力场图中可以直观看到,不同特征对模型预测的影响,红色箭头表示正向影响,蓝色箭头表示负向影响,箭头越大,影响越大。
- 模型应用:研究人员深知,研究成果只有应用到实际中才有意义。于是,他们搭建了一个网站(https://bifeinitong.shinyapps.io/sa_recurrent/),就像建造了一座桥梁,让临床医生、研究人员、患者及其家属都能方便地使用这个预测模型,更好地应对 SAB 复发问题。
研究来到了结论和讨论部分,这就像是对这场 “战斗” 的全面复盘。研究人员通过收集 MIMIC-IV 数据库的数据,分析比较 SAB 和复发性 SAB 患者,筛选出 11 个关键特征,用 5 种机器学习方法构建模型并比较,还分析了 SHAP 值,最终开发出能预测 SAB 复发的模型。这个模型的意义可太大了!一方面,它能帮助医生提前识别 SAB 复发高风险患者,让医生可以对这些患者重点关注、密切监测,在感染初期就及时干预,降低严重并发症的发生风险,提高患者的生存率和生活质量。另一方面,它还能优化抗生素使用策略,医生可以根据模型提供的数据,选择更合适的抗生素和治疗时长,既提高治疗效果,又能减少不必要的抗生素使用,降低耐药风险。而且,减少 SAB 复发,能缩短患者住院时间,降低再入院率,大大减轻医疗资源的负担。
不过,研究人员也很清醒地认识到这次 “战斗” 存在一些不足。比如,再多收集一些有效的炎症标志物,模型可能会更精准;和更多深度学习模型进行比较,能让研究更完善;模型还没有在外部数据库中验证,它在其他数据上的适用性还需要进一步探索。但不管怎样,这次研究为预测 SAB 复发开辟了新道路,就像在黑暗中点亮了一盏希望之灯,指引着后续研究不断前进,为攻克 SAB 复发这个难题带来了新的曙光,相信在未来,随着研究的深入,我们一定能更好地战胜 SAB 这个 “敌人”,守护人们的健康。