
-
生物通官微
陪你抓住生命科技
跳动的脉搏
混合机器学习模型的开发与验证:用于预测肺移植术后结局
《JAMA Network Open》:Development and Validation of a Hybrid Machine Learning Model to Predict Lung Transplant Outcomes
【字体: 大 中 小 】 时间:2025年11月27日 来源:JAMA Network Open 9.7
编辑推荐:
可解释混合机器学习模型用于预测肺移植后1、5、10年死亡或再移植风险,通过分析51,933例数据,模型显示中等判别能力(iAUC 0.61,C-index 0.64),良好校准,决策曲线分析证实临床价值,支持个性化风险分层和共享决策。
问题 一个可解释的混合机器学习模型能否预测肺移植后1年、5年和10年的死亡或再次移植风险?
研究结果 在这项使用UNOS-OPTN队列(包含51,933名接受首次肺移植的成年人)进行的预后研究中,一个包含9个变量的AutoScore-Survival模型显示出中等程度的区分能力(曲线下面积积分值为0.61;C指数为0.64)、良好的校准性能,并且在测试队列中跨时间范围进行了决策曲线分析,显示出净临床益处。
意义 这些结果表明,这种可解释的、可通过网络访问的风险计算器可以支持个体化的术后风险分层、患者咨询以及临床实践中的共同决策。
重要性 肺移植后的长期生存率仍然变化很大,现有的风险分层工具在准确性、临床实用性和可解释性方面存在局限性。
目的 利用联合器官共享网络(United Network for Organ Sharing)的数据,开发、验证并评估一个可解释的混合机器学习模型,以预测肺移植后1年、5年和10年的死亡或再次移植时间。
设计、研究环境和参与者 这项预后研究使用了1987年10月16日至2025年3月26日期间接受肺移植的联合器官共享-器官采购与移植网络(United Network for Organ Sharing–Organ Procurement and Transplantation Network)队列的数据。研究包括51,933名在美国接受首次肺移植的成年患者(年龄≥18岁)。数据被分为开发队列(1987-2014年;n=26,682)和测试队列(2015-2025年;n=25,251)。开发队列进一步分为训练集(n=24,014)和验证集(n=2,668),用于模型选择和超参数调整。
主要结果和指标 研究结果是死亡或再次移植的时间。该模型使用AutoScore-Survival框架进行开发,该框架采用随机生存森林进行变量选择,并使用Cox比例风险回归进行评分。性能评估包括区分能力(时间依赖的曲线下面积[AUC]、Harrell C指数和综合AUC [iAUC])、校准性能(图表、观察到的事件与预期事件的比例以及Brier分数),以及临床实用性(决策曲线分析)。
结果 在51,933名受者中(中位年龄为59岁[第5-95百分位范围:27-71岁];57.6%为男性),中位随访时间为8.97年(95%置信区间:8.93-8.99年),有31,865人(61.4%)发生了事件。最终模型选择了9个预测因子:住院时间、受者年龄、单次移植与多次移植、移植后的通气支持、既往心脏手术史、移植时的肌酐水平、功能状态、总胆红素水平以及供体年龄。在未见过的数据测试集中,该模型显示出中等程度的区分能力,iAUC为0.61(95%置信区间:0.60-0.63),C指数为0.64(95%置信区间:0.63-0.64)。1年时的时间依赖AUC为0.61(95%置信区间:0.52-0.70),5年时为0.59(95%置信区间:0.53-0.65),10年时为0.72(95%置信区间:0.55-0.85)。该模型校准良好,决策曲线分析显示在各个阈值概率下均具有持续的净益处。
结论和相关性 在这项大规模的预后研究中,这种可解释的混合模型为肺移植结果提供了实用且个性化的风险分层。该模型具有中等程度的区分能力、良好的校准性能和明确的临床实用性,支持共同决策,并可通过基于网络的计算器进行访问。
生物通微信公众号
知名企业招聘