基于机器学习和规则分类模型的手术部位感染半自动化监测研究
《npj Digital Medicine》:Semi-automated surveillance of surgical site infections using machine learning and rule-based classification models
【字体:
大
中
小
】
时间:2025年10月19日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对传统手术部位感染(SSI)监测方法劳动强度大、可靠性低的问题,开发了机器学习(ML)和规则基分类模型用于深部和器官/腔隙SSI的半自动化检测。通过对3931例手术患者的前瞻性队列研究,发现朴素贝叶斯和密集神经网络模型在0.5决策阈值下灵敏度达0.90,AUROC达0.968,工作量减少超过90%。研究表明半自动化方法可实现高效准确的SSI监测,为感染预防控制(IPC)提供有力工具。
手术部位感染(SSI)作为最常见的医疗保健相关感染之一,不仅显著增加患者发病率和医疗成本,还导致住院时间延长。世界卫生组织(WHO)已将医疗保健相关感染(HAI)监测确定为有效感染预防和控制(IPC)计划的核心组成部分。然而在大多数医疗机构中,SSI监测仍依赖于感染预防控制专业人员手动查阅所有接受特定手术患者的病历,这种方法不仅耗时耗力,且存在评估者间可靠性低的问题。
随着电子健康记录(eHR)的日益普及,医疗界对转向自动化和半自动化SSI监测的兴趣日益增长。传统监测方法需要筛查大量记录才能识别一例感染,效率低下。为此,研究人员开展了一项创新性研究,开发机器学习(ML)和规则基分类模型,用于深部和器官/腔隙SSI的半自动化检测,旨在显著减少监测工作量,同时最大限度减少未检测到的SSI病例。
这项发表在《npj Digital Medicine》的研究建立在前瞻性收集的3931例手术患者队列基础上,患者包括心脏手术、冠状动脉旁路移植术、结直肠手术、椎板切除术和脊柱融合术等多种手术类型。研究团队采用严谨的方法学设计,重点监测深部切口和器官/腔隙SSI,排表浅感染因其在方法学和实践层面存在特殊挑战。
研究采用前瞻性队列设计,纳入2016年10月至2022年9月在日内瓦大学医院接受手术的成年患者。基于电子健康记录(eHR)数据,研究人员开发了多种机器学习模型(逻辑回归、判别分析、朴素贝叶斯、随机森林、XGBoost和密集神经网络)与规则基分类模型进行对比。通过五折交叉验证优化超参数,使用SHAP值进行模型可解释性分析,并评估了工作量减少(无需手动审查的患者比例)等关键指标。
研究结果显示,朴素贝叶斯分类器和密集神经网络(DNN)模型达到了最佳诊断性能。朴素贝叶斯模型的阴性预测值(NPV)为0.997,接收者操作特征曲线下面积(AUROC)为0.968,精确召回曲线下面积(AUPRC)为0.248,假阴性率(FNR)为10.0%,工作量减少达91.6%。
DNN模型表现类似,NPV为0.996,AUROC为0.924,AUPRC为0.196,FNR为15.0%,工作量减少为90.1%。训练集和验证集之间的性能没有显著下降,表明没有严重的过拟合。
相比之下,规则基模型显示出更高的灵敏度(0.954)但较低的AUROC(0.859)、AUPRC(0.085)和工作量减少(70%)。这一发现揭示了机器学习方法和规则基方法之间的重要权衡:机器学习模型在整体性能和效率方面更优,而规则基方法在灵敏度方面表现更好。
敏感性分析评估了去除难以从电子健康记录中提取的特征对模型性能的影响。去除污染类别特征对朴素贝叶斯和DNN模型的性能影响最小,而去除关键词特征显著影响了朴素贝叶斯模型,但DNN模型对此变化表现出韧性。
在噪声探针敏感性分析中,所有三个随机变量(高斯、均匀和伯努利)在所有模型中均获得最小重要性,支持了模型的稳健性并表明对噪声过拟合的风险较低。
SHAP值分析显示,对于朴素贝叶斯模型,培养物总数和阳性培养物数量是最重要的预测特征,其次是关键词频率和C反应蛋白(CRP)样本数量。而对于DNN模型,最重要的预测特征是CRP样本数量,但对培养数据的依赖较少。这一发现强调了不同模型类型在特征利用方面的差异,为模型选择提供了重要参考。
本研究证实机器学习模型和规则基分类算法在SSI监测中各具优势。机器学习模型提高了AUROC和工作量减少,适用于哨点监测目的;而规则基模型更敏感,更适合监管监测。这种准确性和操作性效率之间的权衡在选择和实施监测方法时需要仔细考虑。
半自动化监测系统可以释放感染预防控制团队的时间,使其能够专注于预防工作。未来研究应侧重于外部验证、整合规则基和机器学习模型的混合方法,以及探索基于序列的模型(如变压器模型),同时评估实际实施的可行性。
该研究的创新之处在于不仅开发了高性能的监测模型,还通过详细的敏感性分析和可解释性研究,为临床实施提供了实用指导。特别是在不同医疗机构的电子健康记录系统差异较大的背景下,研究证明了即使没有某些难以提取的特征,模型仍能保持良好的性能,这大大增强了其实施可行性。
随着医疗数字化进程的加速,这种半自动化监测方法有望在全球范围内推广应用,显著提高医疗质量同时降低感染控制专业人员的工作负担,最终为患者安全提供更强有力的保障。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号