用于预测非心脏手术患者术后谵妄的机器学习模型:系统评价与荟萃分析

《GeroScience》:Machine learning models for predicting postoperative delirium in non-cardiac surgery patients — systematic review and meta-analysis

【字体: 时间:2025年11月16日 来源:GeroScience 5.4

编辑推荐:

  术后谵妄风险预测模型评估显示机器学习模型(如梯度提升、随机森林)的AUROC达0.82,但复杂模型未显著优于早期简单模型,临床可解释性和应用性仍受限,需加强外部验证和临床转化。

  

摘要

对老年手术患者术后谵妄(POD)的早期诊断有助于及时干预并降低发病率。利用机器学习的风险预测模型(RPMs)已成为预测POD的有前景的工具,但其在临床环境中的表现和适用性仍存在不确定性。本系统评价研究了2014年至2024年间开发的针对非心脏手术患者的POD预测模型的预测准确性和质量。通过PubMed和EMBASE系统检索了相关研究。两位作者独立筛选了298篇潜在研究,使用PROBAST(预测模型偏倚风险评估工具)进行质量评估。计算了包括AUROC、敏感性、特异性和精确度在内的综合性能指标。共有22篇文章符合评估标准,其中大多数采用了梯度提升和随机森林等机器学习技术。综合AUROC值为0.82(95%置信区间:0.79–0.85),表明预测准确性处于中等至较高水平。敏感性、特异性和精确度分别为0.78、0.83和0.55。与2014年之前开发的简单模型相比,使用更多预测因子和复杂模型架构的研究并未显著提升性能。虽然新的POD预测模型更有可能经过验证并采用先进的机器学习算法,但其可解释性和临床适用性仍有限。机器学习模型在降低POD发生率方面具有潜力,但需要付出大量努力才能将这些模型整合到临床实践中。未来的研究应重点关注模型的外部验证、减少假阳性预测,并将模型预测转化为临床行动。

对老年手术患者术后谵妄(POD)的早期诊断有助于及时干预并降低发病率。利用机器学习的风险预测模型(RPMs)已成为预测POD的有前景的工具,但其在临床环境中的表现和适用性仍存在不确定性。本系统评价研究了2014年至2024年间开发的针对非心脏手术患者的POD预测模型的预测准确性和质量。通过PubMed和EMBASE系统检索了相关研究。两位作者独立筛选了298篇潜在研究,使用PROBAST(预测模型偏倚风险评估工具)进行质量评估。计算了包括AUROC、敏感性、特异性和精确度在内的综合性能指标。共有22篇文章符合评估标准,其中大多数采用了梯度提升和随机森林等机器学习技术。综合AUROC值为0.82(95%置信区间:0.79–0.85),表明预测准确性处于中等至较高水平。敏感性、特异性和精确度分别为0.78、0.83和0.55。与2014年之前开发的简单模型相比,使用更多预测因子和复杂模型架构的研究并未显著提升性能。虽然新的POD预测模型更有可能经过验证并采用先进的机器学习算法,但其可解释性和临床适用性仍有限。机器学习模型在降低POD发生率方面具有潜力,但需要付出大量努力才能将这些模型整合到临床实践中。未来的研究应重点关注模型的外部验证、减少假阳性预测,并将模型预测转化为临床行动。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号