评估生存推断脆弱性指数：探究其对生存终点治疗效果评估稳健性的意义

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Contemporary Clinical Trials》：Evaluation of the survival-inferred fragility index to assess the robustness of the estimated treatment effect on survival endpoints

【字体：大中小】 时间：2025年05月07日 来源：Contemporary Clinical Trials 2.0

编辑推荐：

　　在肿瘤学 III 期随机临床试验（RCTs）中，为评估新治疗方法的益处常使用右删失终点，生存推断脆弱性指数（SIFI）被用于衡量治疗效果的稳健性，但实际应用中其值较低。研究人员对此展开研究，发现 SIFI 受多种因素影响，不建议将其作为衡量生存试验稳健性的指标。这有助于更准确评估治疗效果。

　　在医学研究领域，肿瘤的治疗一直是备受关注的焦点。随着医疗技术的不断进步，越来越多的新治疗方法涌现，如何准确评估这些治疗方法的效果和稳健性成为关键问题。在肿瘤学的 III 期随机临床试验（Randomized Clinical Trials，RCTs）中，通常会以右删失终点（right censored endpoint）来评估新治疗的益处，即研究数据的分析受限于研究期间，部分数据可能不完整。为了评估研究结果的稳健性，脆弱性指数（Fragility Index，FI）应运而生，它可以衡量统计检验结论在少数个体结果改变时的变化程度。在此基础上，生存推断脆弱性指数（Survival Inferred Fragility Index，SIFI）被提出用于生存终点的研究，然而，在实际应用中，SIFI 的值却非常低，这引发了研究人员的思考，它是否真的能准确衡量治疗效果的稳健性呢？
为了解开这个谜团，来自未知研究机构的研究人员展开了深入研究。他们的研究成果发表在《Contemporary Clinical Trials》上。通过一系列的研究，研究人员发现 SIFI 不应被用作衡量生存试验稳健性的指标，至少在计算时应采用随机选择患者的方式。这一结论对于准确评估肿瘤治疗效果具有重要意义，有助于避免因错误使用指标而导致的对治疗效果的误判，为临床决策提供更可靠的依据。
研究人员采用了多种关键技术方法。首先，进行模拟研究，生成不同治疗效果、样本量和删失程度的生存时间数据，模拟真实的临床试验场景。其次，运用 Cook's 距离，评估个体对生存曲线的影响程度。还提出了删除（Delete）和随机（Random）等改良的 SIFI 计算方法，通过对比不同方法下的 SIFI 值，探究其影响因素和变化规律。
下面详细介绍研究结果：

标准生存推断脆弱性指数（SIFI）的结果：
- 无删失数据情况：Cook's 距离显示生存曲线尾部的受试者影响较大。在零假设（H0）下，基于翻转最佳幸存者的负 SIFI 使结论变化更快，且p值越接近 0.05，负 SIFI 绝对值越低，SIFI 受样本量影响较小。在备择假设（H1）下，SIFI 值仍较低，违反比例风险假设（Proportional Hazards，PH）时，不同治疗效果对改变检验结论所需患者数量有影响，且 SIFI 标准差较大。
- 有删失数据情况：在零假设下，删失比例越高，SIFI 越高，但相对于样本量的比例较低；在备择假设下，SIFI 随删失比例增加而增加，不受样本量影响，违反 PH 假设对不同响应者的 SIFI 有不同影响，引入信息删失时结果变化不大。
随机生存推断脆弱性指数（rSIFI）的结果：在零假设下，随机选择患者改变检验结论更困难，受样本量影响；在备择假设下，虽难改变结论的测试数量减少，但rSIFI 值比标准 SIFI 高。
污染生存推断脆弱性指数（cSIFI）的结果：在零假设和备择假设下，cSIFI 结果与标准 SIFI 的最佳版本相似，最差版本略低。
研究人员重新分析 GRAAPH 2014 试验数据，发现影响最大的患者与 SIFI 计算结果一致，且rSIFI 计算中，多数测试未改变结论，这与模拟研究结果相符。
在讨论和结论部分，研究人员指出 SIFI 受右删失程度影响大，其计算基于特定假设，更像是对特定患者 “污染” 的稳健性度量。随机 SIFI 虽有一定优势，但也受试验设置影响。此外，SIFI 在统计功效过高或过低、结果缺乏临床相关性时存在问题，且对其概率解释不明确。
总体而言，该研究深入剖析了 SIFI 在评估生存试验稳健性方面的作用，为医学研究中正确评估治疗效果提供了重要参考。尽管研究存在一定局限性，如考虑场景有限、未涉及其他稳健性度量方法等，但依然为后续研究指明了方向，推动了医学研究在评估治疗效果稳健性领域的发展。

联系信箱：

粤ICP备09063491号

热点排行