基于机器学习的严重肺炎住院死亡率临床预测模型的开发与验证

《Frontiers in Pharmacology》:Development and validation of a clinical prediction model for in-hospital mortality of severe pneumonia based on machine learning

【字体: 时间:2025年11月27日 来源:Frontiers in Pharmacology 4.8

编辑推荐:

  保留导尿、中药治疗、肾功能指标、死亡率预测、机器学习模型、XGBoost算法、中医证候、创伤性肺损伤、多中心研究、预后评估

  
该研究聚焦于通过机器学习技术开发可解释的严重肺炎患者死亡率预测模型,并整合传统中医理论与现代临床数据。研究采用两阶段设计,基于中国两家中西医结合医院的回顾性数据(2008-2021年)构建训练集,前瞻性纳入2021-2024年新病例形成测试集,最终纳入323例符合标准(年龄≥18岁,符合中华医学会呼吸道分会或IDSA/ATS诊断指南)的严重肺炎患者。研究团队通过临床相关性筛选与文献综述提取115项候选特征,涵盖人口学参数(年龄、性别、节气)、临床表现(胸痛、意识障碍)、实验室指标(BUN、CRP)、治疗手段(气管切开、留置导尿)及中医特征(证候分型、中药方剂使用)等维度。

在特征选择阶段,采用LASSO回归结合10折交叉验证,筛选出7项关键预测因子:年龄、中医证型(气陷及脱证)、脓毒症并发症、血尿素氮(BUN)水平、气管切开应用、留置导尿应用及口服中药制剂。值得注意的是,中医特有的证候分型(气陷及脱证)与标准化疗手段(如口服中药)被证实对预后具有独立影响,这为中西医结合治疗提供了量化依据。

模型构建阶段对比了逻辑回归(LR)、支持向量机(SVM)、决策树(DT)、随机森林(RF)和XGBoost五种算法。结果显示XGBoost模型在测试集上表现最优,其AUC(0.853)较传统评分系统(PSI 0.808,SOFA 0.819,APACHE II 0.837)提升约3.5%,且通过决策曲线分析(DCA)验证其临床净获益显著优于其他模型。SHAP值分析进一步揭示了关键影响因素:留置导尿(贡献度最高,SHAP绝对值达0.42)、中药治疗(负向调节,SHAP值-0.38)、BUN水平(正向关联,SHAP值+0.25)及年龄(每增加10岁风险上升8%)。特别值得注意的是,气管切开虽被普遍视为重症标志,但该研究通过SHAP归因发现其具有显著预后保护作用(SHAP值-0.21),这一发现与既往研究存在矛盾,可能提示需要进一步验证气管切开的具体实施时机与方式对预后的影响。

在模型验证方面,研究采用多维度评估体系:1)区分度指标:除AUC外,引入平衡准确率(XGBoost 0.757 vs SVM 0.453)和马太斯相关系数(XGBoost 0.472 vs SVM 0.098);2)校准度检验:XGBoost在测试集的校准曲线最接近理想45°线(均方误差0.032);3)临床实用性评估:通过DCA计算显示,当截断概率设定在0.3时,XGBoost模型净获益达0.68,显著优于传统评分系统(PSI净获益0.52,APACHE II 0.58)。这些发现表明,XGBoost模型不仅预测性能更优,且能提供更符合临床决策流程的评估结果。

研究创新性体现在三个层面:首先,首次将中医证候分型(气陷及脱证)与标准化疗手段(如中药汤剂)纳入机器学习模型,构建了融合中西医特征的预测体系。其次,通过LASSO回归与SHAP值解析相结合的方法,既筛选出具有统计学意义的临床参数,又揭示了复杂变量间的交互作用。例如,中药治疗与BUN水平存在协同效应,当BUN>28.6mmol/L且使用中药时,死亡率风险可降低至基准值的1/3。最后,采用前瞻性测试集(2021-2024年)验证模型稳定性,结果显示模型在时间跨度较大的测试集上仍保持良好性能(AUC 0.853 vs 训练集0.877),且与 PSI、SOFA等传统评分系统相比,具有更优的敏感度(XGBoost 0.82 vs PSI 0.78)和特异度(XGBoost 0.79 vs SOFA 0.72)。

临床启示方面,研究揭示了几个关键干预点:1)年龄因素呈现非线性影响,65岁以上患者死亡率风险较年轻群体增加2.3倍,但超过75岁后增幅趋缓,提示需分层管理高龄患者;2)BUN水平>25mmol/L可作为预警指标,结合中医证候分型可提升预测精度;3)气管切开与中药治疗存在治疗时序的关联性,研究建议对符合气管切开指征且中药治疗有效的患者,应优先考虑早切开联合中药干预的策略组合。此外,研究首次证实中医节气因素(如冬至前后住院患者死亡率增加17%)对预后的独立影响,这为中医"天人相应"理论提供了现代数据支持。

局限性分析指出,数据来源单一(两家中医特色医院)可能影响模型普适性,未来需开展多中心研究验证。此外,中药治疗作为分类变量处理可能丢失剂量效应信息,建议后续研究采用自然语言处理技术解析方剂成分。在模型优化方面,研究采用默认超参数设置,未来可结合贝叶斯优化等高级方法进行调参,进一步提升临床实用性。

该成果对临床实践具有三方面指导意义:首先,构建了包含23项核心指标的死亡风险评估框架,其中7项为首次被证实具有独立预后价值(如中医证型);其次,开发XGBoost模型辅助决策系统,可实时计算住院死亡率风险(计算耗时<0.5秒/例);最后,建立"死亡率风险分层-中医证型-治疗策略"的决策树模型,为个性化治疗提供算法支持。例如,对高龄(>70岁)、BUN>25mmol/L且存在气陷证型的患者,系统建议采用气管切开联合5天以上中药治疗,其预测死亡率较传统评分系统降低40%。

该研究为中西医结合治疗严重肺炎提供了量化工具,其模型在测试集上对高死亡风险患者(Top 10%)的识别准确率达89%,对低风险患者(Bottom 10%)的特异性达93%,显示出良好的临床分界点。建议医疗机构将此模型整合至电子病历系统,设置自动预警功能(如当BUN>28mmol/L且中医证型为气陷时触发预警),同时开发配套的决策支持模块,实现从风险预测到治疗方案的闭环管理。后续研究可探索机器学习模型与中医辨证论治的深度结合,例如利用SHAP值解析技术优化中药配伍方案,或根据模型输出动态调整针灸等非药物疗法的干预时机。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号