E值敏感性分析在葡萄膜黑色素瘤治疗比较中的局限性评述

《Clinical Drug Investigation》:Comment on: “Tebentafusp Versus Nivolumab Plus Ipilimumab for Metastatic Uveal Melanoma: An E?Value Sensitivity Analysis Assessing Effect of Unmeasured Confounders on Observational Associations”

【字体: 时间:2025年10月29日 来源:Clinical Drug Investigation 2.7

编辑推荐:

  本刊推荐:针对Zhang等人利用E值敏感性分析评估Tebentafusp与纳武利尤单抗联合伊匹木单抗治疗转移性葡萄膜黑色素瘤观察性关联中未测量混杂因素影响的研究,Watkins等学者从方法学角度指出E值分析存在三大局限:未验证混杂因素与总生存期(OS)的双重关联、误用原发性肿瘤复发风险比(RR 6.28)作为转移期混杂指标、以及混淆比值比(OR)/风险比(HR)等不同效应量。该评论强调E值分析未能提供足够证据否定原始倾向评分加权分析中Tebentafusp的生存优势。

  
在恶性黑色素瘤的罕见亚型——葡萄膜黑色素瘤(Uveal Melanoma)的治疗领域,一旦发生转移,患者的预后往往极不乐观。近年来,Tebentafusp作为一种新型T细胞受体双特异性免疫疗法,与纳武利尤单抗(Nivolumab)联合伊匹木单抗(Ipilimumab)的免疫检查点抑制剂组合方案,成为了转移性葡萄膜黑色素瘤(metastatic uveal melanoma)一线治疗的重要选项。然而,由于随机对照试验数据的缺乏,评估这两种疗法孰优孰劣,很大程度上依赖于观察性研究。在此背景下,Piulats等人此前利用患者个体数据,通过倾向评分加权分析(propensity score-weighted analysis)比较了两种方案的总体生存(Overall Survival, OS)获益,发现Tebentafusp与OS改善相关。
这一发现引发了学界的深入讨论。观察性研究的一个核心挑战在于可能存在“未测量的混杂因素”(unmeasured confounders),即那些既影响治疗分配又影响疾病结局、但未被纳入分析的因素,它们可能使观察到的治疗效应产生偏倚。为了评估这种潜在偏倚的影响,Zhang等人在《Clinical Drug Investigation》上发表了一篇研究通讯,他们对Piulats等人的原始分析进行了E值(E-Value)敏感性分析。E值是一种量化工具,用于回答这样一个问题:需要多么强大的未测量混杂因素(同时与治疗和结局相关),才能完全解释所观察到的治疗效果?Zhang等人计算出的E值范围在2.66至4.31之间,并将其与已知协变量(如转移部位,其治疗分配比值比[OR]为8.24)以及另一项研究中局部肿瘤复发与转移风险的关联(风险比[RR]为6.28)进行比较后认为,原始分析中支持Tebentafusp的倾向评分风险比(HR)可能因未测量混杂因素而被否定。
这一结论是否可靠?Watkins、del Carpio和Piulats这三位原作者在本文中提出了严肃的质疑。他们撰写的这封致编辑的信,旨在深入探讨Zhang等人所采用的E值敏感性分析方法存在的局限性,并论证其分析并不足以支撑“原始结果被未测量混杂因素所否定”的论断。该文发表于《Clinical Drug Investigation》,不仅是对特定研究发现的学术争鸣,更触及了观察性研究中敏感性分析方法应用的关键方法论问题,对于正确解读真实世界证据(real-world evidence)具有重要指导意义。
在方法学上,本研究作为一篇评论性文章,其核心在于对已发表研究(Zhang等人的E值分析)进行批判性评估。作者主要依托于他们此前发表的原始研究(Piulats et al., Ann Oncol. 2024)中所使用的患者个体数据(来源:Study 202 和 GEM-1402两个临床研究)及其倾向评分加权分析框架。本文的论证基础是方法学原理和逻辑推理,重点分析了E值这一统计工具的理论假设、应用条件及其在特定临床语境(转移性葡萄膜黑色素瘤)下的适用性。作者并未引入新的数据分析技术,而是通过对比、阐释现有方法(E值分析)的局限,并引用相关文献(如关于E值局限性的方法学论文、转移性葡萄膜黑色素瘤的预后因素研究)来构建其论点。
E值分析的根本局限性
Watkins等人首先指出,E值分析本身存在固有的方法论局限。他们承认,在其原始研究中已明确说明“未测量混杂因素”是该类分析的关键限制,而E值确实是评估结果稳健性(robustness)的有用工具。然而,他们强调,E值并不能直接检验未测量混杂因素的存在与否,它仅仅量化了需要多强的混杂因素才能推翻观察到的效应。E值分析是一种相对“粗糙”的工具,它不利用关于协变量的背景信息或患病率数据来判断某个因素是否可能成为真正的混杂因素,这使得分析容易产生误解。此外,E值分析并未考虑未观察到的混杂因素与已控制的混杂因素之间的相关性,也缺乏判断E值“足够小”的明确标准,而且其他类型的偏倚(如选择偏倚、信息偏倚)也可能影响结果,但这些偏倚无法通过E值来评估。总之,作者认为E值提供的额外信息有限,且可能基于不现实的假设。
对Zhang等人E值分析具体方法的质疑
  1. 1.
    未测量混杂因素需满足的双重关联标准: 作者指出,要否定原始倾向评分风险比(HR),必须存在这样的未测量混杂因素:它在治疗组间不平衡,并且在转移性疾病背景下对总生存期(OS)的影响程度超过E值,同时还需要考虑其与模型中已有变量的相关性。Zhang等人虽然指出了“转移部位”(OR 8.24)和“局部肿瘤复发”(RR 6.28)这两个因素的效应量大于E值,但并未证明“局部肿瘤复发”在转移性疾病的背景下与OS相关。因此,其关于倾向评分HR很可能被未测量混杂因素所否定的论断缺乏足够支持。作者进一步指出,在原始分析的倾向评分中已纳入了通过专家医学评审确定的、在转移背景下已知的预后因素(如ECOG评分、LDH、ALP、年龄、性别等),但这些因素均未同时满足与治疗分配高度相关且与OS高度相关的双重标准(参见文中Table 1)。因此,出现一个未知的、且强度超过这些已知重要预后因素的混杂因素的可能性较低。
  2. 2.
    不恰当的混杂因素引用: Watkins等人批评Zhang等人引用了“局部肿瘤复发”作为潜在的强混杂因素,其依据是一项针对原发性葡萄膜黑色素瘤患者的研究,该研究显示局部复发会增加后续发生转移的风险(RR 6.28)。然而,Watkins等人的原始分析关注的是已经发生转移的患者的OS。在疾病进入转移期后,原发性肿瘤的临床特征(包括局部复发史)已被证明与OS无关。因此,将针对原发性疾病且以转移发生为结局的RR值,用作转移期患者OS分析的未测量混杂因素指标,是不恰当的。
  3. 3.
    不同效应量的混淆使用: 作者指出,Zhang等人在其研究中交替比较了比值比(OR)、风险比(RR)和风险比(HR)。尽管这些指标相关,但它们并非相同的度量,需要谨慎进行比较。
支持Tebentafusp疗效的间接证据
作者还提供了一个支持Tebentafusp疗效的间接论据:已知伴有肝外转移的患者使用纳武利尤单抗联合伊匹木单抗方案生存期更长。而在原始分析中,即使未经调整的分析也显示Tebentafusp与OS改善相关,尽管该分析未考虑Tebentafusp组中肝外转移患者比例较低这一不平衡因素。这从侧面说明了Tebentafusp的疗效可能确实存在。
研究结论与意义
Watkins等人最终得出结论,Zhang等人进行的E值计算并未提供足够证据表明存在足以否定其原始研究结果的未测量混杂因素。他们承认E值在某些情况下可能是一个有益的工具,但强调在本次针对转移性葡萄膜黑色素瘤治疗比较的具体应用中,其所采用的E值敏感性分析方法存在上述显著局限性。
这项致编辑的信的意义在于,它及时纠正了对观察性研究敏感性分析结果的潜在误读。在循证医学时代,真实世界研究的重要性日益凸显,但如何恰当地评估和解释其结果的可靠性至关重要。本文通过清晰的逻辑和专业的论证,指出了在应用E值等统计工具时,必须紧密结合具体的临床背景和研究设计,避免机械式的比较和过度解读。它提醒研究人员和临床医生,在评估观察性研究结论时,应全面考量方法学的适用条件及其与临床实际的契合度。对于转移性葡萄膜黑色素瘤这一治疗选择有限的疾病领域,本文维护了基于现有最佳证据(即倾向评分加权分析)得出的Tebentafusp可能具有生存优势的结论,为临床决策提供了重要的参考依据,同时也推动了观察性研究方法学讨论的深入。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号