间接治疗比较中比例风险模型风险比的应用风险:统计传递性视角下的警示与替代方案

《Research Synthesis Methods》:The hazards of using hazard ratios from proportional hazard models in indirect treatment comparisons

【字体: 时间:2025年12月18日 来源:Research Synthesis Methods 6.1

编辑推荐:

  为解决间接治疗比较(ITC)中风险比(HR)的滥用问题,研究人员开展了一项关于统计传递性的主题研究。研究通过理论证明和实例分析,揭示了HR在比例风险(PH)假设不满足时并非统计传递性指标,可能导致间接比较结果偏倚甚至悖论。该研究意义重大,为ITC方法学提供了关键理论支撑,并推荐了限制性平均生存时间(RMST)等更可靠的替代指标。

  
在医学产品研发和卫生技术评估(HTA)中,当缺乏头对头随机对照试验(RCT)时,间接治疗比较(ITC)被广泛用于评估不同治疗方案的相对有效性。在生存结局分析中,风险比(HR)是最常用的效应指标。然而,发表在《Research Synthesis Methods》上的一项研究,由Ziren Jiang、Jialing Liu、Weili He、Joseph Cappelleri、Satrajit Roychoudhury、Yong Chen和Haitao Chu共同完成,揭示了在ITC中不加选择地使用HR可能带来的严重风险。
该研究首次从统计传递性(Statistical Transitivity)的角度,系统论证了HR并非一个统计传递性指标。这意味着,即使在理想的三臂随机试验中,通过共同对照C间接比较药物A与B的HR,也可能与直接比较A与B的HR存在差异。这种差异并非源于随机误差,而是HR作为效应指标的内在数学属性。研究通过理论证明、膀胱癌手术的实例分析以及模拟的悖论案例,生动地展示了使用HR进行ITC可能导致结论不一致甚至完全相反的风险。研究团队强调,HR的传递性仅在所有治疗组间满足比例风险(PH)假设时才成立,而这一假设在现实世界中往往难以满足且检验效能不足。
为了克服HR的局限性,研究推荐了三种具有良好传递性且临床解释性更强的替代指标:限制性平均生存时间(RMST)差异、特定时间点的里程碑生存概率差异(或比值)以及生存权重平均风险(AH-SW)差异(或比值)。这些指标不依赖于PH假设,能够提供更稳健、更可靠的间接比较结果。该研究为从事证据合成、网络Meta分析和卫生技术评估的研究人员提供了重要的方法学警示和实用的替代方案,强调了在选择效应指标时评估其统计传递性的必要性。
主要技术方法
本研究主要采用理论推导、模拟研究和实例分析相结合的方法。理论部分通过数学证明阐述了HR的统计传递性条件。模拟研究通过生成特定参数的数据,直观展示了HR在ITC中可能产生的悖论。实例分析则利用公开的膀胱癌三臂随机试验数据,通过R软件重构个体患者数据(IPD),并应用匹配调整间接比较(MAIC)方法,计算了HR、RMST和里程碑生存概率等指标,验证了理论结论。
研究结果
HR并非统计传递性指标:一个实例分析
研究首先通过一个膀胱癌手术的实例来直观展示HR的非传递性。该实例数据来源于一项比较开放根治性膀胱切除术(ORC)、腹腔镜根治性膀胱切除术(LRC)和机器人辅助根治性膀胱切除术(RARC)的三臂随机试验。将RARC设为药物A,ORC设为药物B,LRC设为共同对照C。通过Cox比例风险模型计算,直接比较A与B的对数HR为0.394。然而,通过共同对照C进行间接比较,即A与C的对数HR(0.701)减去B与C的对数HR(0.247),得到的结果为0.454。两者之间存在明显差异,这直接证明了HR并非统计传递性指标。
HR期望值的非传递性定理
研究进一步通过理论证明,阐明了HR非传递性的根本原因。定理指出,HR的期望值具有传递性(即HRAB= HRAC/ HRBC)的充要条件是,所有三个治疗组(A、B、C)之间均满足比例风险(PH)假设。这意味着,只要PH假设在任意一组间不成立,HR的期望值就不具备传递性。因此,在ITC中使用HR作为效应指标,其有效性高度依赖于一个在现实中往往难以验证且经常被违反的强假设。
模拟的悖论案例
为了更生动地展示HR在ITC中的风险,研究设计了一个模拟的悖论案例。在该案例中,药物A和C的生存曲线满足PH假设,而药物B的生存曲线不满足PH假设。模拟结果显示,直接比较A与B的HR为0.896(95% CI: 0.840, 0.956),表明药物A显著劣于药物B。然而,通过共同对照C进行间接比较,得到的HR为1.296(95% CI: 1.117, 1.440),却表明药物A显著优于药物B。这个案例清晰地表明,使用HR进行ITC可能导致完全相反的结论,严重误导临床决策。
随访时间差异的额外挑战
研究还指出,除了非传递性外,HR在ITC中还面临另一个挑战:HR对随访时间高度敏感。由于HR本质上是整个随访期内时间依赖性HR的加权平均,因此其数值会随着随访时间的变化而变化。在ITC中,AC试验和BC试验的随访时间往往不同,这导致两个试验中共同对照C的HR估计值可能不可比,进一步破坏了HR在ITC中的有效性。
替代指标的推荐与应用
鉴于HR的上述局限性,研究推荐了三种具有良好统计传递性的替代指标,并详细阐述了如何在匹配调整间接比较(MAIC)的框架下应用这些指标。
  • 限制性平均生存时间(RMST)差异:RMST定义为生存曲线下面积,是一个模型无关的指标,不依赖于PH假设,且临床解释直观。在MAIC中,可以通过加权Kaplan-Meier曲线来估计RMST,进而计算RMST差异。
  • 里程碑生存概率差异(或比值):指在预设时间点(如3年、5年)的生存概率。该指标同样具有传递性,且易于临床医生理解和沟通。
  • 生存权重平均风险(AH-SW)差异(或比值):由Uno和Horiguchi提出,定义为累积分布函数与RMST的比值。该指标同样具有传递性,且对随机删失不敏感。
结论与讨论
本研究系统论证了HR在间接治疗比较(ITC)中并非统计传递性指标,其有效性严格依赖于比例风险(PH)假设在所有治疗组间均成立这一强条件。在PH假设不满足的情况下,使用HR进行ITC可能导致结果偏倚,甚至产生与直接比较相悖的结论。此外,HR对随访时间的敏感性进一步限制了其在ITC中的应用。
研究强调,在选择ITC的效应指标时,应优先考虑具有良好统计传递性的指标,如限制性平均生存时间(RMST)差异、里程碑生存概率或生存权重平均风险(AH-SW)差异。这些指标不仅统计性质更稳健,而且临床解释性更强。研究还建议,在进行ITC时,应同时评估临床传递性(如共同对照的一致性)和统计传递性,并采用多种效应指标进行敏感性分析,以确保结果的可靠性。
该研究为证据合成和卫生技术评估领域提供了重要的方法学警示,呼吁研究人员在生存结局的ITC中,从HR转向更可靠、更透明的替代指标,以提升研究结论的科学性和临床价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号