综述：效应估计何时、为何以及如何在人群间转移？应用可转移性方法研究的范围综述

【字体：大中小】 时间：2025年04月19日 来源：European Journal of Epidemiology 7.7

编辑推荐：

　　这篇综述聚焦可转移性方法（transportability methods）在因果推断研究中的应用。通过系统检索相关文献，分析了 64 项研究，阐述了效应估计在人群间转移的时机、原因和方式，指出应用中存在的问题，并对未来研究方向提出建议，对推动该领域发展有重要参考价值。

引言

在因果推断研究里，当从研究样本推断到非研究样本（的随机样本）的目标人群时，效应估计的外部效度（external validity）至关重要。但实现外部效度困难重重，比如不同人群中协变量分布不同，会使治疗效果产生差异。随机对照试验（RCT）即便内部效度高，能对研究样本得出无偏效应估计，可要是研究样本并非目标人群的随机样本，或与目标人群不同，就会缺乏外部效度。观察性研究试图代表特定人群，但其结果可能不适用于其他目标人群。元分析或多中心 RCT 虽能得出合并效应估计，但不清楚这些估计如何应用于具体人群。

重复研究能获取新人群的有效效应估计，然而受基础设施、资金、时间和伦理等因素限制，这种方法往往不可行。可转移性方法是一种较新的解决人群间效应异质性的途径，它旨在通过调整不同分布的协变量，将效应估计从源人群转移到目标人群，进而提升研究结果的外部效度，可用于源人群和目标人群至少部分不重叠的情况。此前的综述多聚焦于可转移性假设、估计器和数据情况，未系统检索文献且未关注其应用，而本研究对应用可转移性方法的研究进行了范围综述，梳理效应估计转移的相关情况。

方法

本研究遵循系统评价和荟萃分析扩展的范围综述首选报告项目（PRISMA-ScR）清单，对应用可转移性方法的研究展开范围综述。

在 2024 年 12 月 18 日，检索了 MEDLINE（Ovid）、Embase、Web of Science、EconLit 和 Google Scholar 数据库。检索词为 “transportability” 或 “transport” 与研究相关词汇的组合，并排除 “transporter” 及其变体。检索范围限定在 2010 年及以后发表的研究，完整检索语法见补充材料。

检索结果去重后，由两位作者（FMR 和 VB）独立筛选标题和摘要，再对入选研究的全文进行独立筛选，意见分歧通过讨论解决，筛选过程使用 Covidence 软件。

纳入标准为：一是在数值应用中从源人群向目标人群转移效应估计；二是解决可转移性问题，即源人群样本中至少部分成员在目标人群样本中的概率为 0%。未设排除标准。

研究分为两类，一类是仅应用可转移性方法的研究（应用研究），旨在运用现有可转移性方法解决实际研究问题；另一类是应用且聚焦于开发与可转移性相关方法的研究（方法学研究），旨在开发新方法并应用。在方法学研究中，又进一步区分是否提出新的随机数据可转移性估计器、特定可转移性应用（如元分析、中介分析）或其他方法学方面（如协变量选择、缺失数据处理）。研究由两位作者（FMR 和 VB）独立分类，分歧通过讨论解决。

数据由一位作者提取，另一位作者（FMR 和 VB）交叉核对。提取所有研究的作者、发表年份和数据来源，以及应用研究和方法学研究的特定数据。对于应用研究，提取源人群和目标人群数据、研究主题、使用可转移性方法的原因，以及方法应用的相关方面；对于方法学研究，提取引入的方法、相关假设、应用类型等。

结果

数据库检索共识别出 5792 项研究，去重后筛选 3432 项研究的标题和摘要，获取 166 项研究的全文评估 eligibility，最终 64 项研究符合纳入标准。其中应用研究仅占不到三分之一（20/64），超三分之二是聚焦引入新方法的研究（44/64）。

从 2016 年首次发表相关研究到 2024 年 12 月 18 日，每年发表的应用可转移性方法的研究数量呈上升趋势，2024 年发表数量最多（20/64），但该年应用研究的发表数量（1/20）比 2017 年以来的任何一年都少。

应用研究中，多数源人群数据来自多中心 RCT（16/20），其他来自观察性研究（3/20）或多个 RCT（1/20）。目标人群数据多为观察性数据（11/20），其次是 RCT 数据（6/20），部分使用假设目标人群（3/20）或基于观察数据模拟的数据（1/20）。目标人群的治疗和结局数据，完全可用和不可用的情况各占 9/20，2/20 为部分可用。

应用可转移性方法最常见的研究场景是将效应从多中心 RCT 转移到有观察性或假设性数据且数据不完整的目标人群（10/20），其次是从有 RCT 数据的源人群转移到有完整 RCT 数据的目标人群（6/20）。

目标人群数据不完整时，使用可转移性方法的原因多是从 RCT 估计效应推断到更大人群（7/10）或假设数据代表的特定目标人群（3/10）。目标人群数据完整时，从 RCT 数据推断旨在研究效应异质性可由测量的效应修饰因子或中介解释的程度；从观察性数据推断则是评估效应异质性、比较不同假设下的估计效应等。

应用研究在描述可转移性方法应用时，常报告人群描述、协变量选择方法、缺失数据处理、阳性假设和结局模型假设评估、可转移性估计器、估计模型和敏感性分析等。多数研究用表格总结源人群和目标人群及其差异，部分会计算标准化均数差异或进行均数差异检验。协变量选择方法多样，有的依据文献、临床知识或专家意见，有的纳入分布不同的协变量，还有用随机森林等方法，超半数研究未报告具体选择方法。多数研究描述了缺失数据处理方式，多采用单值插补、多重插补等方法，部分进行列表删除。多数研究评估了阳性假设和共同结局模型假设，常用的可转移性估计器有逆抽样概率加权（12/20）、结局建模（4/20）和双稳健估计器（5/20）等，多数研究使用参数估计模型（17/20），超半数研究进行了敏感性分析。有完整目标人群数据的研究中，超半数评估了效应异质性。

方法学研究提出了从随机数据转移估计的新估计器（5/44）、特定可转移性应用（21/44）和其他方法学方面的内容（18/44）。引入的估计器包括逆抽样概率加权、结局建模等，特定应用涵盖观察性数据应用、元分析、中介分析等，其他方面涉及协变量选择、缺失数据处理等问题。方法学研究大多报告了阳性假设（40/44）和可交换性假设（39/44），部分研究还提及共同结局模型假设等。部分研究介绍的估计器具有双稳健性，不同估计器在特定模型正确设定时具有稳健性。方法学研究常用模拟和真实世界示例（23/44）展示新方法应用，也有用真实世界示例（13/44）或仅模拟示例（5/44）的情况。

多项研究重复使用了一些数据来源，如艾滋病临床试验组数据库（ACTG）数据使用最多（6/44），MTO 试验数据（5/44）用于新方法示例和分析位点差异，ACCORD-BP 试验数据（5/44）用于多种目的。

讨论

本研究对 20 项应用研究和 44 项方法学研究进行范围综述。应用研究中，源人群和目标人群数据组合多样，多数源人群数据来自多中心 RCT。目标人群数据不完整时，常将效应转移到更大人群；数据完整时，多评估效应异质性是否可由测量因素解释。

虽然可转移性方法在因果推断研究中愈发重要，但目前应用于实际研究问题的较少。方法应用的差异以及缺乏统一指导，阻碍了其广泛应用。协变量选择对避免偏差和降低转移估计方差至关重要，但应用研究中的选择方法不一，文献中也有多种建议。选择可转移性估计器也是关键决策，多数应用研究使用逆抽样概率加权或结局建模，双稳健估计器使用较少。未来研究可探索将可转移性方法应用于准实验研究设计。

本研究的优势在于多数据库检索和迭代数据提取，局限性包括未考虑源人群和目标人群完全重叠的研究、排除非数值应用研究、未检索灰色文献以及研究时间范围有限，且未评估研究质量。

通过分析可转移性方法的应用情况，发现需要更多关于效应估计转移的指导和建议，以促进该方法在实际研究中的应用，提升研究结果的外部效度。

引言

方法

结果

讨论

热点排行

新闻专题