
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在患者数据缺失的情况下,利用预测性平均法和基于Rubin规则的模型集成方法进行生存风险预测,并结合数据填补技术:通过两个案例研究和模拟进行方法验证
《BMC Medical Research Methodology》:Predictive averaging and Rubin’s rule-based model pooling to predict survival risk with imputations in the presence of missing patient data: methodology and verification using two case studies and simulations
【字体: 大 中 小 】 时间:2026年06月11日 来源:BMC Medical Research Methodology 3.4
编辑推荐:
摘要背景在实际估计患者风险时,预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中,我们研究了在以下情况下患者风险预测模型的校准和应用:用于拟合预测模型的过去患者数据中包含这些缺失值,同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。方法本文详
在实际估计患者风险时,预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中,我们研究了在以下情况下患者风险预测模型的校准和应用:用于拟合预测模型的过去患者数据中包含这些缺失值,同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。
本文详细探讨了在预测中使用多重插补方法来处理过去(校准数据)和未来患者预测变量记录中的缺失值。我们介绍了两种可以考虑使用插补来处理缺失值的方法。一种方法是直接对基于不同数据插补得到的生存预测结果进行平均。另一种方法则是首先将这些模型的中间效应和基线估计值汇总,然后再从汇总模型中计算预测结果。例如,这种汇总估计值可以通过Rubin规则获得。基于两个示例数据集介绍了这些方法并进行了演示。文中还详细研究了Cox回归生存模型的应用,并通过交叉验证、独立验证集和广泛的模拟研究验证了这些方法的性能。
在偏差和Brier分数(准确性)评估方面,所有方法都是可比的。然而,在使用不同插补集重复进行拟合过程时,以及使用相同数量的插补值时,这两种方法之间存在显著差异。预测平均法更为优越,因为通过增加插补次数,这些重复预测之间的差异可以降至零,而汇总模型则无法实现这一点。
当使用多重插补处理缺失的预测变量数据时,应优先选择预测平均法,而不是使用单一的汇总模型。对于缺失数据,不应使用单一插补方法进行预测。
在实际估计患者风险时,预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中,我们研究了在以下情况下患者风险预测模型的校准和应用:用于拟合预测模型的过去患者数据中包含这些缺失值,同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。
本文详细探讨了在预测中使用多重插补方法来处理过去(校准数据)和未来患者预测变量记录中的缺失值。我们介绍了两种可以考虑使用插补来处理缺失值的方法。一种方法是直接对基于不同数据插补得到的生存预测结果进行平均。另一种方法则是首先将这些模型的中间效应和基线估计值汇总,然后再从汇总模型中计算预测结果。例如,这种汇总估计值可以通过Rubin规则获得。基于两个示例数据集介绍了这些方法并进行了演示。文中还详细研究了Cox回归生存模型的应用,并通过交叉验证、独立验证集和广泛的模拟研究验证了这些方法的性能。
在偏差和Brier分数(准确性)评估方面,所有方法都是可比的。然而,在使用不同插补集重复进行拟合过程时,以及使用相同数量的插补值时,这两种方法之间存在显著差异。预测平均法更为优越,因为通过增加插补次数,这些重复预测之间的差异可以降至零,而汇总模型则无法实现这一点。
当使用多重插补处理缺失的预测变量数据时,应优先选择预测平均法,而不是使用单一的汇总模型。对于缺失数据,不应使用单一插补方法进行预测。