基于倾向性评分加权估计与预测性方法的比较:人工喂养对欧亚红松鼠行为耐受性的因果效应研究

【字体: 时间:2025年09月18日 来源:Ecology and Evolution 2.3

编辑推荐:

  本综述系统比较了因果推断(倾向性评分方法,如IPW和OW)与预测性方法(AIC和LASSO)在生态观测数据中的应用。通过模拟研究和实例分析(以欧亚红松鼠Sciurus vulgaris为例),研究证实倾向性评分方法能有效控制混杂变量(confounding variables),准确估计处理变量(如人工喂养)对结果变量(如FID和VED)的因果效应,为野生动物保护管理提供了更可靠的统计工具。

  

2 倾向性评分因果推断简介

本文简要介绍了基于倾向性评分的因果推断方法,重点阐述其核心概念与操作框架。该方法通常假设数据集包含三种变量:二值处理变量Z(如是否接受处理)、结果变量Y和混杂变量X。其核心目标是在存在混杂因素的情况下,准确估计Z对Y的因果效应。

倾向性评分定义为给定协变量条件下个体接受处理的概率,即e(X)=P(Z=1|X)。该评分通常通过逻辑回归或非参数机器学习方法进行估计。因果效应的定义基于反事实框架(potential outcome),将个体i的因果效应定义为处理与未处理情形下结果值的差异,即τi=Yi(1)-Yi(0)。由于反事实值无法同时观测,该框架转而估计群体层面的平均因果效应。

在随机对照试验(RCT)中,处理分配与协变量无关,平均因果效应可直接通过处理组与对照组结果均值之差得到。但在观测性研究中,处理分配常与混杂变量相关,直接比较会带来偏差。倾向性评分通过平衡处理组与对照组间协变量的分布来模拟RCT,校正这种偏差。

常用估计方法包括匹配估计量、加权估计量和协变量调整回归。加权估计量如逆概率加权(IPW)和重叠加权(OW)通过为每个观测值分配权重来调整组间差异。IPW通过逆概率进行加权,但易受极端权重影响;OW则通过重叠权重函数e(X)(1-e(X))减小对极端值的敏感性,提高协变量平衡性。

不同估计量对应不同的目标总体(estimand):处理组平均处理效应(ATT)、对照组平均处理效应(ATU)、总体平均处理效应(ATE)和重叠总体平均处理效应(ATO)。ATT适用于评估已实施处理的效果,ATU适用于评估将处理扩展到新群体的潜在效果,ATE适用于全域统一推行政策的情形,而ATO则适用于处理分配概率相近的群体,其目标群体无法用简单条件公式表达,更适合于成本效益权衡的决策场景。

倾向性评分方法的优势在于其半参数特性,无需完全参数化模型,对模型误设更稳健,且样本量要求低于结构方程模型(SEM)。这些特点使其在无法进行RCT的生态学观测研究中具有广泛应用潜力。

3 方法

3.1 模拟研究

本研究通过模拟分析比较了倾向性评分方法与预测性方法(AIC和LASSO)在估计处理效应方面的性能。模拟数据包含混杂变量(X1至X6)、二值处理变量(Z)和连续结果变量(Y)。数据生成过程设定Z通过逻辑回归生成,Y通过线性模型生成,其中包含处理效应和混杂效应。系数b控制混杂效应强度。

研究评估了四种估计量:逆概率加权(IPW)、重叠加权(OW)、基于AIC的模型选择和LASSO估计。通过计算点估计偏差和95%置信区间的覆盖概率来比较各方法的性能。实验在不同样本量(N=50,100,200)和混杂强度(b=0.5,1.0,1.5,2.0)下重复10000次。

3.2 实际数据应用

3.2.1 数据收集

研究采用Uchida等人(2021)的原始数据,分析人工喂养对欧亚红松鼠(Sciurus vulgaris)行为耐受性的影响。数据来自日本北海道带广市12个城市公园的野外观察,测量了飞行起始距离(FID)和垂直逃跑距离(VED)作为结果变量,同时记录了环境变量和人工喂养情况。混杂变量包括公园内人流量(NH)、树木数量(TN)、绿地比例(PGS)和周边人口密度(P)等。

3.2.2 数据预处理

连续变量均标准化为均值0、标准差1。缺失数据通过MCAR检验后,使用多重插补法生成1000个伪完整数据集。

3.2.3 统计分析

研究比较了两种统计方法:一是基于AIC和LASSO的预测性方法,通过线性回归模型选择重要变量并估计喂养效应;二是基于倾向性评分的因果推断方法,通过逻辑回归估计倾向评分,再使用重叠加权(OW)估计喂养对FID和VED的因果效应。通过Bootstrap抽样计算标准误和置信区间,并使用Rubin规则合并多重插补结果。

4 结果

4.1 模拟研究

模拟结果显示,倾向性评分方法(IPW和OW)在各种样本量和混杂强度下均能提供无偏估计,且置信区间覆盖概率接近名义水平95%。相反,AIC和LASSO则表现出明显的估计偏差,且置信区间覆盖概率偏低,尤其在样本量较小或混杂较强时更为明显。LASSO的偏差随样本量增加改善有限,覆盖概率甚至低至2%,表明其用于因果推断可能存在严重问题。

4.2 实际数据应用

应用于红松鼠数据,重叠加权成功平衡了混杂变量的组间差异(标准化均值差小于0.01)。OW估计显示人工喂养对FID和VED的效应(-1.12和-1.07)大于AIC(-1.00和-0.57)和LASSO(-0.79和-0.44)的估计。OW的置信区间表明喂养对FID有显著影响,而AIC和LASSO则未能检测到这一效应。

5 讨论

5.1 倾向性评分方法的统计性能

本研究通过模拟和实例分析证实,倾向性评分方法能够有效控制混杂偏差,提供更可靠的因果效应估计。预测性方法如AIC和LASSO由于变量选择策略,常忽略重要混杂变量,导致估计偏差和误导性推断。在红松鼠实例中,OW估计提示人工喂养对行为耐受性的影响可能比既往认识更大,表明依赖预测性方法可能低估处理效应。

5.2 对野生动物保护与管理的潜在意义

倾向性评分方法为生态学观测研究提供了一种强大的因果推断工具,有助于识别影响生物多样性保护和野生动物管理的关键驱动因素。在红松鼠案例中,更准确的效应评估可为公园管理提供科学依据,帮助权衡人工喂养的利弊(如增强人类与自然互动的同时可能增加疾病传播风险),支持更有效的管理决策。

5.3 倾向性评分方法的局限与未来应用

倾向性评分方法的有效性依赖于处理组与对照组间倾向评分分布的重叠程度。若两组间协变量分布差异过大,可能导致估计依赖少数样本,降低可靠性。虽然重叠加权等方法对分布差异较传统方法更稳健,但仍需在研究设计阶段考虑样本平衡问题。此外,因果概念多样,不同方法基于不同的因果框架,实际应用中需明确其理论假设和适用范围。

作者贡献与利益声明

Yusaku Ohkubo负责概念化、形式分析、方法设计与论文撰写;Ozora Takeda参与数据整理与分析;Kenta Uchida负责数据收集、调查与资源提供。作者声明无利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号