在患者数据缺失的情况下，利用预测性平均法和基于Rubin规则的模型集成方法进行生存风险预测，并结合数据填补技术：通过两个案例研究和模拟进行方法验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Medical Research Methodology》：Predictive averaging and Rubin’s rule-based model pooling to predict survival risk with imputations in the presence of missing patient data: methodology and verification using two case studies and simulations

【字体：大中小】 时间：2026年06月11日 来源：BMC Medical Research Methodology 3.4

编辑推荐：

　　摘要背景在实际估计患者风险时，预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中，我们研究了在以下情况下患者风险预测模型的校准和应用：用于拟合预测模型的过去患者数据中包含这些缺失值，同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。方法本文详

摘要

背景

在实际估计患者风险时，预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中，我们研究了在以下情况下患者风险预测模型的校准和应用：用于拟合预测模型的过去患者数据中包含这些缺失值，同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。

方法

本文详细探讨了在预测中使用多重插补方法来处理过去（校准数据）和未来患者预测变量记录中的缺失值。我们介绍了两种可以考虑使用插补来处理缺失值的方法。一种方法是直接对基于不同数据插补得到的生存预测结果进行平均。另一种方法则是首先将这些模型的中间效应和基线估计值汇总，然后再从汇总模型中计算预测结果。例如，这种汇总估计值可以通过Rubin规则获得。基于两个示例数据集介绍了这些方法并进行了演示。文中还详细研究了Cox回归生存模型的应用，并通过交叉验证、独立验证集和广泛的模拟研究验证了这些方法的性能。

结果

在偏差和Brier分数（准确性）评估方面，所有方法都是可比的。然而，在使用不同插补集重复进行拟合过程时，以及使用相同数量的插补值时，这两种方法之间存在显著差异。预测平均法更为优越，因为通过增加插补次数，这些重复预测之间的差异可以降至零，而汇总模型则无法实现这一点。

结论

当使用多重插补处理缺失的预测变量数据时，应优先选择预测平均法，而不是使用单一的汇总模型。对于缺失数据，不应使用单一插补方法进行预测。

背景

在实际估计患者风险时，预测变量的值未被观测到或缺失往往会使这一过程变得复杂。在本文中，我们研究了在以下情况下患者风险预测模型的校准和应用：用于拟合预测模型的过去患者数据中包含这些缺失值，同时未来的患者记录也可能部分缺失。这类情况常见于预后观察性研究或注册数据中。

方法

本文详细探讨了在预测中使用多重插补方法来处理过去（校准数据）和未来患者预测变量记录中的缺失值。我们介绍了两种可以考虑使用插补来处理缺失值的方法。一种方法是直接对基于不同数据插补得到的生存预测结果进行平均。另一种方法则是首先将这些模型的中间效应和基线估计值汇总，然后再从汇总模型中计算预测结果。例如，这种汇总估计值可以通过Rubin规则获得。基于两个示例数据集介绍了这些方法并进行了演示。文中还详细研究了Cox回归生存模型的应用，并通过交叉验证、独立验证集和广泛的模拟研究验证了这些方法的性能。

结果

在偏差和Brier分数（准确性）评估方面，所有方法都是可比的。然而，在使用不同插补集重复进行拟合过程时，以及使用相同数量的插补值时，这两种方法之间存在显著差异。预测平均法更为优越，因为通过增加插补次数，这些重复预测之间的差异可以降至零，而汇总模型则无法实现这一点。

结论

当使用多重插补处理缺失的预测变量数据时，应优先选择预测平均法，而不是使用单一的汇总模型。对于缺失数据，不应使用单一插补方法进行预测。

联系信箱：

粤ICP备09063491号

摘要

背景

方法

结果

结论

背景

方法

结果

结论

热点排行