基于机器学习算法的经导管主动脉瓣置换术患者住院时长预测模型构建及临床意义分析

【字体: 时间:2025年06月26日 来源:JACC: Advances CS2.7

编辑推荐:

  本研究针对TAVR术后住院时长(LOS)预测难题,利用Biome数据库中9,172例患者数据开发随机森林机器学习模型,识别出物理治疗需求、手术时长等22个关键预测因子,模型AUC达0.82-0.85,显著优于传统多变量模型,为优化临床路径提供数据支持。

  

随着经导管主动脉瓣置换术(TAVR)在美国获批用于低中高风险严重主动脉瓣狭窄患者,该技术已成为美国最常见的主动脉瓣置换方式。尽管TAVR的并发症发生率、住院时长和死亡率持续改善,但预测患者术后住院时长(LOS)仍存在显著差距。特别是在COVID-19大流行期间,医疗资源分配面临严峻挑战,准确预测LOS对优化资源配置显得尤为重要。

针对这一临床需求,研究人员利用Biome多中心数据库开展了一项大规模回顾性研究。该数据库汇集了美国21家医疗中心2017-2021年间执行的TAVR手术临床和财务数据,其中12家中心年手术量超过100例。研究团队最终纳入了9,172例门诊TAVR病例,排除了术前LOS无法确定或数据缺失超过5%的病例。

研究采用监督式机器学习方法,将病例随机分为70%训练集和30%测试集。通过随机森林算法构建预测模型,重点分析短住院时长(SLOS,<36小时)和长住院时长(LLOS,≥72小时)的预测因子。模型开发过程中采用递归特征消除交叉验证(RFECV)确定最优预测变量数量,并通过基尼评分量化各变量的相对重要性。

在技术方法上,研究团队运用了几项关键技术:首先采用随机森林算法处理大量连续和分类变量,该技术对异常值和过拟合具有鲁棒性;其次使用RFECV技术筛选最具预测力的变量组合;最后通过SHapley Additive exPlanations(SHAP)值分析解释各预测因子的作用方向。所有分析均基于Biome数据库中的临床和手术数据,包括患者特征、手术参数和术后管理等信息。

研究结果部分呈现了丰富发现:

【研究人群】分析显示,纳入的9,172例患者平均年龄79.4岁,43%为女性,平均STS风险评分4.3%。2017-2021年间,SLOS比例从18%显著上升至68%,LLOS比例从28%下降至12%。

【随机森林模型开发与测试】SLOS模型识别出20个重要预测因子,其中术后转入阶梯病房而非ICU最具预测力,其次是手术开始时间、STS评分和手术时长等。模型测试显示灵敏度0.81,特异度0.70,AUC 0.82。LLOS模型包含22个变量,在加入SLOS预测后,物理治疗需求成为最强预测因子,模型特异度达0.94,AUC 0.85。

【预测因子分析】SHAP值分析揭示了各变量的作用方向:转入阶梯病房、无需物理治疗、不使用全身麻醉与SLOS正相关;而较高STS评分、较长手术时间、较低KCCQ-12评分则与较长LOS相关。值得注意的是,手术开始时间较早与未达SLOS标准相关,这可能与上午手术患者术前LOS较短但术后LOS较长有关。

【讨论与结论】部分指出,该研究首次应用机器学习算法预测TAVR术后LOS,不仅验证了已知预测因子如STS评分和麻醉方式的重要性,还发现了物理治疗需求、手术时长等新预测指标。特别是术后转入阶梯病房这一管理因素成为最强预测指标,为临床路径优化提供了明确方向。虽然存在未测量混杂因素等局限,但该模型显著优于传统多变量方法,AUC提高约0.2。

这项研究的意义在于:首先,机器学习模型的高预测性能可帮助临床团队提前识别可能延长住院的患者,针对性调整管理策略;其次,发现的物理治疗需求等新预测因子提示应加强术前康复评估;最后,研究结果为制定个体化出院计划提供了数据支持,有望在保证医疗质量的同时优化资源配置。随着TAVR适应症扩大和手术量增长,这类预测工具将在价值医疗实践中发挥越来越重要的作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号