基于可解释机器学习的血流感染合并症特异性死亡风险评分
《Journal of Infection》:Interpretable machine learning based comorbidity specific mortality risk score for bloodstream infections
【字体:
大
中
小
】
时间:2025年11月22日
来源:Journal of Infection 11.9
编辑推荐:
血流感染异质性评分模型(BHScore)通过整合早期纵向临床数据,针对肾脏病、肝病、恶性肿瘤等共病亚组优化阈值,显著提升28天死亡率预测准确性和时间稳定性(AUROC 0.81-0.91),优于SOFA、Pitt评分等传统模型,并配有在线工具辅助临床决策。
本研究聚焦于血液感染(BSI)的短期死亡风险预测,提出了一种名为BSI异质性评分(BHScore)的新型预测模型。BSI是导致脓毒症的主要原因之一,其临床管理的复杂性在于病情在短时间内可能迅速恶化,从而影响患者的预后。因此,早期准确识别高危患者对于优化治疗策略和降低死亡率具有重要意义。现有的预测工具在处理复杂临床数据、识别异质性病理机制以及提供可解释的模型方面存在局限,限制了其在临床中的应用。本研究通过整合早期纵向临床数据、采用分层建模方法,并结合可解释的机器学习技术,开发出一种具有更优预测性能和时间稳定性的新评分系统。
### 临床背景与研究意义
BSI作为一种严重的感染性疾病,其影响范围广泛且后果严重。全球每年因BSI导致的死亡人数超过290万,且患者在发病初期往往病情进展迅速,尤其是在医院内死亡率可达10%至30%。这使得BSI的早期风险评估成为临床实践中的关键环节。然而,传统预测方法,如SOFA评分、Pitt细菌血症评分和BLOOMY评分,尽管已被广泛应用,但它们在处理异质性病理机制和提供明确的临床解释方面存在不足。此外,当前的评分系统通常依赖于单时间点的检测结果,无法准确捕捉疾病在时间维度上的动态变化,从而限制了其对早期病情恶化的识别能力。
本研究旨在解决这些挑战,开发一种新的评分系统——BHScore,以实现对BSI患者28天死亡率的精准预测。该评分系统基于机器学习方法,利用患者入院后7天内的纵向临床数据进行建模,同时针对不同的合并症进行分层分析,以提高预测的准确性和实用性。BHScore不仅能够有效识别高危患者,还能够通过可解释的变量选择机制,为临床医生提供更直观的决策支持。研究团队还开发了一个在线计算工具,方便临床人员快速应用该评分系统,从而在资源有限的环境中实现风险分层管理。
### 方法与模型构建
本研究采用多中心数据,结合回顾性队列分析和外部验证数据,构建了BHScore模型。Xijing医院的电子病历数据被用于模型的开发,而Xuzhou第一医院和Xi'an第一医院的数据则作为外部验证数据。这些医院分别位于中国西部和东部,相距超过700公里,以确保数据的多样性。研究严格遵循STROBE指南进行数据报告,并获得了相关伦理委员会的批准。
在数据处理方面,研究团队对变量进行了初步筛选,排除了缺失率超过50%或存在非生理学异常的变量。例如,温度超过42℃或低于34℃等极端值被剔除。随后,对时间序列数据进行了处理,包括每日的生理指标记录和药物使用情况的分析。对于药物变量,采用了解剖学、治疗学与化学分类系统(ATC)进行分类,并结合连续的用药天数作为变量进行建模。此外,研究团队还通过Spearman相关性分析控制多重共线性,最终筛选出74个关键变量用于模型构建。
模型的开发基于XGBoost算法,这是一种高效的梯度提升框架,能够处理非线性关系并提供较高的预测性能。为了进一步优化模型,研究团队采用了网格搜索法进行超参数调优,并结合五折交叉验证确保模型的稳健性。此外,研究还比较了其他机器学习方法,如随机森林(RF)、梯度提升机(GBM)和支持向量机(SVM),以评估XGBoost在预测性能上的优势。结果显示,XGBoost在整体队列和各子组中均表现出较高的预测准确率(ACC)、受试者工作特征曲线下面积(AUROC)和精确率-召回率曲线下面积(AUPRC)。
为了增强模型的可解释性,研究团队采用了SHAP(SHapley Additive exPlanations)算法,该算法能够量化每个变量对预测结果的贡献。通过SHAP值的分析,研究明确了各变量在不同合并症患者中的重要性,并绘制了变量重要性图谱(beeswarm plots)以直观展示各变量对模型输出的影响。研究发现,年龄、ICU入院、高炎症标志物和免疫抑制状态是影响死亡率的普遍风险因素。而凝血功能异常,如血小板减少、延长的凝血酶原时间(PT)和凝血时间(TT),则在多个子组中均被识别为关键风险因素。
### 模型性能与临床适用性
BHScore的构建过程分为三个主要步骤:变量筛选、评分生成和效能验证。首先,通过SHAP分析筛选出对死亡率有显著影响的变量,并利用SHAP集成解释分析确定各变量在不同子组中的具体阈值。其次,将筛选出的变量转化为评分,以形成一个综合的风险评分系统。最后,通过与传统评分系统的比较,验证BHScore在预测准确性和时间稳定性方面的优势。
研究结果显示,BHScore在整体队列和各子组中均表现出优于现有评分系统的能力。例如,在整体队列中,BHScore的AUROC为0.867±0.05,而SOFA评分仅为0.636±0.04。此外,BHScore在时间维度上保持了较高的稳定性,能够准确反映患者病情的动态变化。相比之下,传统评分系统往往在时间变化中出现波动,难以持续提供可靠的预测信息。研究还发现,对于肾病合并症患者,尿素(UREA)和尿酸(UA)的异常水平与死亡率显著相关;而对于肝病合并症患者,直接胆红素(DBIL)的升高是重要的预测指标;而在转移性恶性肿瘤合并症患者中,炎症标志物如IL-6的升高则与较高的死亡风险相关。
为了进一步验证模型的临床适用性,研究团队对两个外部验证队列进行了分析。结果表明,BHScore在大多数子组中均表现出优越的预测能力,尤其是在肾病和恶性肿瘤合并症患者中。然而,在肝病合并症患者中,BHScore的预测稳定性略低于其他子组,这可能与样本量较小(n=37)以及肝功能衰竭的异质性有关。因此,未来的研究需要进一步优化肝病合并症的变量权重,以提高模型的准确性。
### 模型的临床应用与可解释性
BHScore的一个显著优势在于其可解释性。该模型不仅能够提供准确的预测结果,还能通过SHAP分析解释每个变量对预测的贡献。这种可解释性对于临床医生至关重要,因为他们在决策过程中往往更倾向于基于明确因果关系的预测结果。通过SHAP值的分析,研究团队能够识别出哪些变量在特定合并症患者中具有更高的风险权重,并据此制定更精准的干预策略。
此外,BHScore的在线计算工具为临床实践提供了便利。该工具通过用户友好的界面,允许医生输入常规临床参数并选择合并症类型,从而快速生成28天死亡率风险评分。这一工具无需专业培训或软件安装,适用于资源有限的医疗机构,有助于提高BSI患者的管理效率。工具的开发还基于多中心数据验证,确保其在不同医疗环境中的适用性。
### 研究发现与临床启示
研究发现,某些临床变量在不同合并症患者中的风险权重存在显著差异。例如,年龄超过70岁的患者在肾病合并症子组中仅被赋予1.0的权重,而在其他子组中则被赋予更高的权重(如3.0)。这表明,虽然年龄是BSI死亡率的重要预测因素,但其影响在不同合并症患者中存在差异。类似地,PT和TT在恶性肿瘤合并症患者中的权重较高,而UREA和UA的异常则在肾病和肝病患者中表现出不同的风险模式。
这些发现强调了在BSI风险评估中考虑合并症特异性的重要性。传统评分系统往往采用统一的变量权重,无法充分反映不同合并症对预后的影响。相比之下,BHScore通过分层建模和可解释的变量选择,能够更精准地识别高危患者,并为临床干预提供更具体的指导。例如,在恶性肿瘤合并症患者中,凝血功能异常可能与肿瘤相关性凝血病有关,而肾病合并症患者则可能因尿素和尿酸水平异常导致更严重的预后恶化。
### 局限性与未来方向
尽管BHScore在多个方面表现出优越的性能,但研究仍存在一些局限性。首先,数据集中正负样本的数量存在显著不平衡,可能导致较高的假阳性率。其次,时间序列分析未充分考虑多个变量之间的联合趋势以及药物和医疗措施的影响,这可能影响模型的全面性。最后,某些关键生物标志物(如IL-6和UA)在常规临床实践中可能难以获取,限制了模型的广泛应用。
未来的研究可以进一步优化模型,以解决这些局限性。例如,可以通过引入更多的临床变量或采用更复杂的建模方法来提高预测的准确性。此外,研究还可以探索不同合并症之间的相互作用,以及如何通过动态调整变量权重来适应不同患者的临床特征。同时,开发更便捷的临床工具,如移动应用或集成在电子病历系统中的评分模块,也将有助于BHScore的推广和应用。
### 总结
本研究通过开发BHScore,为BSI患者的短期死亡风险预测提供了新的方法。该模型结合了纵向临床数据、分层建模和可解释的机器学习技术,不仅提高了预测的准确性,还增强了临床医生对模型结果的理解和信任。BHScore的临床应用潜力巨大,尤其是在资源有限的环境中,能够帮助医生快速识别高危患者并采取及时干预措施。然而,未来的研究仍需进一步优化模型,以克服当前的局限性,并探索其在更广泛人群中的适用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号