部分线性模型在非单调缺失数据下的统一估计方法及其在因果推断中的应用

【字体: 时间:2025年08月28日 来源:Biometrical Journal 1.8

编辑推荐:

  这篇综述创新性地提出了针对部分线性模型(PLM)在非单调缺失数据(MAR)场景下的统一估计方法(UE)。通过建立部分线性工作模型,该方法显著提升了传统完整病例分析(WCC)的估计效率,并证明了新估计量的一致性不依赖于工作模型的正确性。研究采用半参数模型估计缺失概率,结合自助法(bootstrap)计算渐近方差,为处理任意缺失模式提供了计算简便的解决方案,在观察性研究的因果效应分析中具有重要应用价值。

  

1 引言

在观察性研究中,部分线性模型(PLM)被广泛用于分析治疗或暴露对连续型响应变量的因果效应,特别是在存在连续型预处理混杂变量的情况下。与传统参数回归模型相比,PLM具有稳健性优势——无需对混杂变量设定参数化函数形式,且能提供因果零假设的渐近无分布检验。然而当数据存在缺失时,PLM的推断变得复杂。

近年来的缺失数据分析多聚焦于参数模型(如Ibrahim等2005提出的方法),难以直接应用于PLM。虽然增强逆概率加权估计方程(AIPW)已被扩展至处理协变量缺失的场景,但其计算复杂度高,尤其对非单调缺失模式不友好。统一估计方法(UE)的提出为这一问题提供了新思路,该方法通过构建工作模型提取不完整观测中的部分信息,在保证估计一致性的同时提升效率。

2 符号与假设

研究设定响应变量Y、处理变量X和混杂变量Z构成的PLM框架,其中Z允许存在非单调缺失。通过定义缺失指示变量矩阵R和缺失概率矩阵π,提出受限MAR假设:缺失机制仅依赖于完全观测变量。值得注意的是,本研究创新性地采用"按变量计数"缺失模式(最大K种模式),而非传统"按个体计数"(最大2K种模式),大幅降低了计算复杂度。

3 研究方法

3.1 加权完整病例估计

基于完整病例的逆概率加权估计方程采用Horvitz-Thompson(HT)加权局部线性核估计处理非线性成分。理论证明该估计量具有渐近正态性,且其性质不依赖于所选非参数方法,但存在效率损失问题。

3.2 统一估计量

通过为每个缺失模式建立部分线性工作模型,构建包含所有可用数据的加权估计量。关键创新点在于:

  1. 1.

    通过条件均值转换将估计量表达为线性组合形式

  2. 2.

    证明当权重取逆方差时估计量达到最小方差

  3. 3.

    采用自助法估计渐近方差,避免复杂的三明治方差计算

  4. 4.

    可扩展至响应变量和协变量同时缺失的场景

模拟研究显示,对于真实混杂变量,UE的效率提升显著(相对效率提高32%),而对无关协变量改进有限,印证了方法的靶向性优势。

4 模拟验证

在设定X~N(0,1)、Z=0.5X+ε的模拟框架下,比较了全数据、WCC和UE三种方法的性能。结果显示:

  • 对处理效应β1=1的估计:UE(1.09,95%CI 0.95-1.23)比WCC(1.02,0.79-1.27)更接近真实值

  • 对混杂效应β2=-1的估计:UE(-0.86)较WCC(-0.88)显著改善

  • 带宽选择采用留一交叉验证法,500次bootstrap重复保证推断可靠性

5 实际应用

在芝加哥大学髋部骨折病例对照研究中,分析体脂指数(BMI)与年龄、血红蛋白(Hgb)、白蛋白(Alb)的关系时:

  1. 1.

    处理38种稀疏缺失模式(21种仅含单一个体)

  2. 2.

    采用半参数最大似然估计(Zhao 2020方法)处理缺失概率

  3. 3.

    发现Alb效应呈非线性(p<0.01)

  4. 4.

    UE使年龄效应估计的标准误降低14.7%

6 讨论与展望

该方法的价值在于:

  1. 1.

    计算简便性:仅需标准软件即可实现

  2. 2.

    模型稳健性:工作模型正确性非必要条件

  3. 3.

    扩展性强:可结合Cholesky分解(Yao & Li 2013)处理纵向数据

    未来研究方向包括开发更高效的半参数缺失概率估计方法,以及探索深度学习在缺失模式识别中的应用。研究结果对流行病学调查和临床观察性研究的设计与分析具有重要指导意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号