
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习模型预测感染性心内膜炎患者死亡风险:一项基于随机森林算法的临床决策支持研究
【字体: 大 中 小 】 时间:2025年07月02日 来源:BMC Medical Informatics and Decision Making 3.3
编辑推荐:
针对感染性心内膜炎(IE)预后评估工具的局限性,广东医学科学院团队通过LASSO回归、随机森林(RF)等四种机器学习算法构建预测模型。研究发现RF模型对住院死亡(AUC-ROC=0.83)和6个月死亡(AUC-ROC=0.85)预测效能最优,总胆红素、NT-proBNP等被确认为关键预测因子,为临床早期风险分层提供了新工具。
感染性心内膜炎(IE)被称为"心脏的癌症",尽管抗生素和手术技术进步,其住院死亡率仍高达15-30%,1年死亡率攀升至40%。这种致命心血管疾病临床表现多变且进展迅猛,犹如体内埋设的"定时炸弹"。当前临床使用的EuroSCORE II、STS IE等评分系统存在明显缺陷:依赖手术患者数据、样本量有限、未纳入关键实验室指标,如同用不完整的拼图预测风暴轨迹。更严峻的是,约20%需要手术的患者因禁忌症或经济原因无法接受手术,现有模型对这些高危人群的预测几乎"失明"。
广东医学科学院联合团队在《BMC Medical Informatics and Decision Making》发表的研究,首次将机器学习"武器库"——包括LASSO回归、随机森林(RF)、支持向量机(SVM)和K近邻(KNN)四种算法——系统应用于IE预后预测。研究纳入1705例患者数据,通过10折交叉验证发现,RF模型展现出最卓越的预测性能,其预测住院死亡和6个月死亡的AUC-ROC分别达到0.83和0.85,远超传统评分。更引人注目的是,模型识别出总胆红素这个"预警灯塔",其预测价值超过所有已知指标,揭示了肝功能与全身炎症风暴的潜在关联。
关键技术方法包括:1) 单中心回顾性收集1705例符合改良Duke标准的IE患者临床数据;2) 采用随机森林多重插补处理缺失值;3) 对比四种机器学习算法性能;4) 通过10折交叉验证评估模型,以AUC-ROC为主要终点;5) 分析变量重要性揭示关键预测因子。
【研究结果】
描述性分析:手术患者占比73.1%,住院死亡率7%(119例),6个月死亡率10.6%。死亡组患者年龄更大(51.39±16.23 vs 45.31±15.72岁),NYHA III/IV级比例更高(59.66% vs 29.69%)。
死亡率预测:RF模型性能显著优于其他方法,其预测住院死亡的灵敏度达78%,特异性81%。SVM模型表现次优(AUC-ROC=0.79),而传统逻辑回归方法(AUC-ROC=0.72)暴露线性模型的局限性。
变量重要性:

【结论与意义】
这项研究构建了首个涵盖手术与非手术IE患者的机器学习预测系统,打破传统评分"手术中心主义"局限。RF模型通过捕捉总胆红素与NT-proBNP等标志物的非线性关系,将预测精度提升至临床实用水平。特别值得关注的是,模型识别出既往被忽视的肝功能指标(总胆红素)的核心地位,为IE多器官损伤机制研究开辟新视角。
临床转化方面,研究者开源了模型代码(GitHub可获取),使床旁快速风险评估成为可能。对于资源有限地区,仅需检测7项关键指标(总胆红素、NT-proBNP等)即可完成风险评估,这种"精准而经济"的策略尤其适合发展中国家。该研究同时提出警示:当前指南推荐的评分可能低估非手术患者风险,亟需基于机器学习的新标准指导临床决策。
未来研究需解决两大局限:单中心数据的推广性验证,以及通过过采样技术改善死亡病例的类不平衡问题。但无论如何,这项工作标志着心血管预后预测正式迈入"机器学习时代",其方法论框架可扩展至其他复杂疾病的风险建模。
生物通微信公众号
知名企业招聘