《Contemporary Clinical Trials》:Evaluation of the survival-inferred fragility index to assess the robustness of the estimated treatment effect on survival endpoints
编辑推荐:
在肿瘤学 III 期随机临床试验(RCTs)中,为评估新治疗方法的益处常使用右删失终点,生存推断脆弱性指数(SIFI)被用于衡量治疗效果的稳健性,但实际应用中其值较低。研究人员对此展开研究,发现 SIFI 受多种因素影响,不建议将其作为衡量生存试验稳健性的指标。这有助于更准确评估治疗效果。
在医学研究领域,肿瘤的治疗一直是备受关注的焦点。随着医疗技术的不断进步,越来越多的新治疗方法涌现,如何准确评估这些治疗方法的效果和稳健性成为关键问题。在肿瘤学的 III 期随机临床试验(Randomized Clinical Trials,RCTs)中,通常会以右删失终点(right censored endpoint)来评估新治疗的益处,即研究数据的分析受限于研究期间,部分数据可能不完整。为了评估研究结果的稳健性,脆弱性指数(Fragility Index,FI)应运而生,它可以衡量统计检验结论在少数个体结果改变时的变化程度。在此基础上,生存推断脆弱性指数(Survival Inferred Fragility Index,SIFI)被提出用于生存终点的研究,然而,在实际应用中,SIFI 的值却非常低,这引发了研究人员的思考,它是否真的能准确衡量治疗效果的稳健性呢?
为了解开这个谜团,来自未知研究机构的研究人员展开了深入研究。他们的研究成果发表在《Contemporary Clinical Trials》上。通过一系列的研究,研究人员发现 SIFI 不应被用作衡量生存试验稳健性的指标,至少在计算时应采用随机选择患者的方式。这一结论对于准确评估肿瘤治疗效果具有重要意义,有助于避免因错误使用指标而导致的对治疗效果的误判,为临床决策提供更可靠的依据。
研究人员采用了多种关键技术方法。首先,进行模拟研究,生成不同治疗效果、样本量和删失程度的生存时间数据,模拟真实的临床试验场景。其次,运用 Cook's 距离,评估个体对生存曲线的影响程度。还提出了删除(Delete)和随机(Random)等改良的 SIFI 计算方法,通过对比不同方法下的 SIFI 值,探究其影响因素和变化规律 。
下面详细介绍研究结果:
- 标准生存推断脆弱性指数(SIFI)的结果:
- 无删失数据情况:Cook's 距离显示生存曲线尾部的受试者影响较大。在零假设(H0)下,基于翻转最佳幸存者的负 SIFI 使结论变化更快,且p值越接近 0.05,负 SIFI 绝对值越低,SIFI 受样本量影响较小。在备择假设(H1)下,SIFI 值仍较低,违反比例风险假设(Proportional Hazards,PH)时,不同治疗效果对改变检验结论所需患者数量有影响,且 SIFI 标准差较大。
- 有删失数据情况:在零假设下,删失比例越高,SIFI 越高,但相对于样本量的比例较低;在备择假设下,SIFI 随删失比例增加而增加,不受样本量影响,违反 PH 假设对不同响应者的 SIFI 有不同影响,引入信息删失时结果变化不大。
- 随机生存推断脆弱性指数(rSIFI)的结果:在零假设下,随机选择患者改变检验结论更困难,受样本量影响;在备择假设下,虽难改变结论的测试数量减少,但rSIFI 值比标准 SIFI 高。
- 污染生存推断脆弱性指数(cSIFI)的结果:在零假设和备择假设下,cSIFI 结果与标准 SIFI 的最佳版本相似,最差版本略低。
研究人员重新分析 GRAAPH 2014 试验数据,发现影响最大的患者与 SIFI 计算结果一致,且rSIFI 计算中,多数测试未改变结论,这与模拟研究结果相符。
在讨论和结论部分,研究人员指出 SIFI 受右删失程度影响大,其计算基于特定假设,更像是对特定患者 “污染” 的稳健性度量。随机 SIFI 虽有一定优势,但也受试验设置影响。此外,SIFI 在统计功效过高或过低、结果缺乏临床相关性时存在问题,且对其概率解释不明确。
总体而言,该研究深入剖析了 SIFI 在评估生存试验稳健性方面的作用,为医学研究中正确评估治疗效果提供了重要参考。尽管研究存在一定局限性,如考虑场景有限、未涉及其他稳健性度量方法等,但依然为后续研究指明了方向,推动了医学研究在评估治疗效果稳健性领域的发展。