旨在扩大筛查与改善结局策略的总效应评估：一种因果分析框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Statistics in Medicine》：A Causal Framework for Evaluating the Total Effect of Strategies Aiming to Expand Screening and to Improve Outcomes

【字体：大中小】 时间：2026年06月29日 来源：Statistics in Medicine 2.1

编辑推荐：

　　对于多种健康问题而言，高效的治疗与预防手段已然存在。然而，要最大化其公共卫生影响，仍需制定相应策略以扩大健康筛查的覆盖范围，从而识别潜在获益人群。例如，HIV预防策略旨在扩大风险筛查范围，并提高处于风险中人群的暴露前预防（PrEP）使用率。这些策略通常在群体层

对于多种健康问题而言，高效的治疗与预防手段已然存在。然而，要最大化其公共卫生影响，仍需制定相应策略以扩大健康筛查的覆盖范围，从而识别潜在获益人群。例如，HIV预防策略旨在扩大风险筛查范围，并提高处于风险中人群的暴露前预防（PrEP）使用率。这些策略通常在群体层面（如医疗机构或社区）实施，并通过集群随机试验（CRTs）进行评估。此场景催生了一个复杂的多层中介-缺失数据问题，原因如下：首先，策略在集群层面实施，而健康筛查与结局指标却在个体层面；其次，策略既可通过改善健康筛查间接改善健康结局，也可直接发挥作用；第三，每个个体均存在"潜在"状态，但该状态仅在接受筛查者中被观察到。为在此类情境下正式定义总效应，研究人员采用反事实分层效应（Counterfactual Strata Effects）作为因果估计量，即结局仅对于受缺失机制影响且/或受暴露影响的特定群体具有相关性。为识别并估计相应的统计估计量，研究人员提出了一种新颖的两阶段靶向最小损失估计（TMLE）扩展方法。模拟研究验证了该方法的实际性能，同时揭示了现有方法的局限性。

**研究背景与问题**

在公共卫生领域，众多高效治疗与预防手段的获益实现依赖于健康筛查作为首要步骤。以HIV防治为例，HIV检测是启动抗逆转录病毒治疗（ART）和暴露前预防（PrEP）的先决条件；类似地，血压测量是启动降压治疗的前提，低密度脂蛋白胆固醇（LDL-C）检测是他汀类药物使用的基础。因此，"状态知晓"构成了照护级联（Care Cascade）的第一支柱，即从识别需求人群到确保持续治疗/预防使用的系列步骤。然而，健康筛查的覆盖率鲜少达到100%，导致治疗/预防工作的目标人群通常处于"未知"状态，即存在数据缺失问题。

为在人群层面改善健康状况，需要同时提升筛查覆盖率与干预效果的策略。此类策略可通过村级卫生团队或同伴介入等社区拓展方式实施，也可通过医疗机构整合服务或药房提供新服务等途径实现。这些策略通常在群体层面部署或诱导群体层面变化，涉及的群体包括社区、药房、诊所和卫生系统等。

在此类情境中，健康筛查构成中介变量，即处于暴露（策略）与结局（治疗/预防采纳）之间因果路径上的中间变量。同时，健康筛查也可视为竞争事件，因为结局仅在个体参与筛查后方可发生。尽管存在多种中介效应指标（如控制直接效应、自然直接与间接效应、随机直接与间接效应以及可分离直接与间接效应），但在评估新型健康策略时，首要关注点在于评估其总因果效应，即包含直接与间接效应的综合作用，而非急于探究中介路径。

此外，健康筛查作为关键测量指标，所有个体均存在"潜在"健康状态，但该状态仅在接受筛查时被观察到。策略旨在改善目标关注人群（如所有HIV风险人群）的结局，无论其是否参与筛查。因此，不能简单评估策略在已筛查人群中的效应，而标准回归方法因会阻断间接效应、使总效应估计产生向零偏倚，亦不适用。亟需新方法以在人群层面估计总效应，同时严谨处理已测量与未测量人群之间的差异。

**研究开展与核心结论**

针对上述多层中介-缺失数据问题，研究人员以OPAL研究为动机实例，该研究旨在评价肯尼亚和乌干达酒类服务场所成年人群中基于社区的招募策略对PrEP使用率的影响。研究人员首先通过分层因果模型描述数据生成过程，继而使用反事实分层效应正式定义因果估计量——该估计量适用于结局仅对受缺失影响且/或受暴露影响群体具有相关性的情形。为实现识别与估计，研究人员采用两阶段TMLE方法，将缺失数据控制与效应评估相分离。模拟研究验证了所提方法的有限样本性能，并与现有方法进行了比较。

主要研究发现发表于《Statistics in Medicine》，证实两阶段TMLE方法能够获得近似无偏估计且达到名义置信区间覆盖率，而传统方法则存在显著缺陷。具体而言，单阶段方法（如广义估计方程GEE和标准TMLE）因以筛查状态或其后代为条件， methodologicaly 阻断了间接效应，导致总效应估计向零偏倚；两阶段框架中仅基于筛查者或资格者的简单方法亦因未正确靶向估计量而产生偏倚；即使是基于比值但未调整筛查选择性的方法仍存在残余偏倚。相比之下，第一阶段采用TMLE处理缺失数据假设、第二阶段采用TMLE提高效率的两阶段方法，在所有样本量下均实现可忽略偏倚和名义覆盖率，且自适应预选协变量可进一步提升效率。

**关键技术方法**

本研究采用两阶段靶向最小损失估计（TMLE）框架。第一阶段针对各集群分别处理：将集群层面参数简化为关注人群中的反事实结局概率，通过将因果估计量重新表达为联合概率（结局与关注人群状态）与关注人群 prevalence 之比，分别估计分子与分母；分子采用经验比例估计，分母在随机缺失（MAR）假设下使用TMLE结合超级学习器（Super Learner）进行灵活估计，允许调整集包含集群内其他成员特征及子集群特征。第二阶段基于第一阶段获得的集群层面终点估计，实施集群层面TMLE以最大精度评估总效应，采用自适应预选（Adaptive Pre-specification）从候选算法中数据自适应地选择最大化经验效率的调整方案。统计推断基于渐近线性性质，使用影响曲线方差估计及Student's t分布构建Wald型置信区间。模拟研究设置涵盖20至70个集群、平均规模200人的场景，与单阶段GEE、单阶段TMLE及多种两阶段简化方法进行比较。

**研究结果**

**OPAL动机研究**：该研究为肯尼亚和乌干达农村地区酒类服务场所成年人中评价社区招募策略对PrEP使用效果的持续集群随机试验。随机化单位为附近场所组成的群组，干预组提供多病筛查招募卡，对照组提供HIV专项筛查招募卡，持卡者在诊所接受筛查并根据兴趣和资格启动PrEP。研究具有典型的多层中介-缺失数据结构：个体嵌套于集群内，HIV风险筛查介导干预效应，且HIV风险状态仅在筛查时被观察到。

**数据生成过程与因果模型**：通过分层非参数结构方程模型形式化变量间因果关系，包含集群层面基线协变量、干预分配、个体层面基线特征、潜在关注人群指标、测量指标及结局变量。模型设定若干排除限制：试验臂完全随机化；试验臂不影响潜在状态（如不改变HIV风险状态）；潜在状态不影响筛查行为；观察状态仅为潜在状态与测量行为的函数；筛查对结局的唯一作用通过确定关注人群身份实现。

**反事实分层效应**：正式定义的因果估计量为干预组与对照组反事实结局期望之差，关注于所有潜在关注人群中的结局概率。该估计量不假设强制100%筛查依从性的假想干预，属于意向性治疗参数，捕获关注人群中的直接与间接效应总和。反事实分层效应区别于主分层效应（基于潜在变量联合值的不可观测类别）和Young等提出的竞争事件框架（关注明确定义队列中的时间-事件结局，而非本研究聚焦的受缺失影响的目标人群）。

**两阶段TMLE估计与推断**

**第一阶段：各集群内识别与估计**：完全按集群分层，简化数据结构为个体层面变量；因果估计量简化为关注人群中的反事实结局概率，重新表达为联合概率与关注人群 prevalence 之比。分子简化为观察到的结局比例；分母在MAR假设下，即给定基线协变量后筛查者的健康状态代表未筛查者，通过G-计算公式识别，使用TMLE估计，其中超级学习器用于灵活估计结局回归和测量机制。此步骤实施次数等于集群数，获得各集群的终点估计。

**第二阶段：总效应识别与估计**：基于第一阶段获得的集群层面终点，评估策略总效应。数据为集群层面的终点估计、基线协变量聚合及干预分配。虽可采用未调整效应估计（臂间均值差），但为实现最大精度，实施集群层面TMLE：更新集群层面结局回归的初始估计，利用集群层面倾向评分信息，获得各试验臂期望结局的目标估计。采用自适应预选程序，预设候选算法（有限集群时限于调整单一协变量的工作广义线性模型，较多集群时纳入逐步回归和多元自适应回归样条等），以影响曲线平方作为损失函数，通过交叉验证选择最小化交叉验证风险估计的调整方案组合，默认包含未调整估计作为候选。

**统计推断**：两阶段TMLE具有多重稳健性。第一阶段TMLE在各集群内提供一致估计；第二阶段TMLE提供模型稳健的效率最大化程序。渐近线性条件下，估计量行为 empirical mean of mean-zero有限方差影响曲线；以估计影响曲线的样本方差除以独立单位数获得方差估计，使用自由度为集群数的Student's t分布构建置信区间。有限样本性能通过模拟研究评估。

**扩展应用**：方法一扩展至时变协变量情境，允许干预影响关注人群定义；此时时间变量协变量既受干预影响，又同时影响筛查行为和结局，形成时变混杂。按集群分层仍使第一阶段因果估计量保持不变，但以基线和时变协变量为条件的MAR假设可调整更大调整集，分母识别需纳入时变协变量。方法二允许干预直接影响关注人群，此时关注人群成为干预策略的函数，两阶段方法仍适用，保持相同的第一阶段估计量形式。

**讨论与结论**

**方法学贡献**：本研究针对健康策略同时扩大覆盖范围和改善结局时产生的特殊挑战，建立了系统的因果分析框架。现有处理差异结局测量的方法会阻断间接效应、使总效应估计向零偏倚。通过因果模型明确数据生成过程，使用反事实分层效应定义无需强制100%筛查依从性的因果估计量，并扩展两阶段TMLE进行估计推断，解决了这一方法论难题。模拟研究证实所提方法获得名义置信区间覆盖率，而传统方法 failed 显著。

**局限性与未来方向**：两阶段TMLE完全按集群分层在第一阶段可能导致小集群或大调整集时数据支持不足，需探索自适应跨集群池化策略，但该方法需 predictable homogeneity assumptions。本研究聚焦于匹配OPAL研究的二分类结局，方法同样适用于其他类型结局。当前框架针对集群随机试验设计，计划扩展至非随机的观察性研究（需在第二阶段调整集群层面混杂）以及个体随机试验（或可通过构建人工集群并加权实施两阶段程序）。此外，当前分别估计分子和分母后取比值的程序，虽通过Delta方法保证渐近线性和半参数效率界限，但直接靶向比值的TMLE仍有待开发。

**研究结论翻译**：当健康策略旨在扩大目标人群覆盖并改善结局时，会出现新的挑战与机遇。具体而言，策略既可通过扩大覆盖间接改善结局，也可直接发挥作用，而结局仅在覆盖到达者中测量。在这种常见情境下，现有处理差异结局测量的方法将有效阻断间接效应，使总效应估计向零偏倚。基于先前工作，研究人员使用因果模型明确数据生成过程，并以反事实分层效应定义因果估计量，该估计量捕获潜在目标人群中的干预效应，而无需强制100%的筛查依从性。继而扩展了两阶段TMLE框架进行估计和推断。模拟研究表明，所提出方法获得了名义置信区间覆盖率，而更传统的方法则 failed 。研究人员计划在OPAL试验的主要预设分析中使用这一新颖方法，该试验评价肯尼亚和乌干达酒类服务场所成年人中基于社区的招募策略对生物医学HIV预防使用的效果。

联系信箱：

粤ICP备09063491号

热点排行