灵活参数加速失效时间模型与治愈机制的创新拓展及应用研究

【字体: 时间:2025年09月13日 来源:Biometrical Journal 1.8

编辑推荐:

  本综述系统介绍了灵活参数加速失效时间(AFT)模型的重大拓展,包括引入单调自然样条约束、时变加速因子(含治愈模型)以及混合与非混合治愈模型。文章通过rstpm2软件包实现这些功能,并证明AFT模型在存在治愈案例时仍保持稳健的协变量效应估计能力,优于Cox比例风险(PH)模型,为临床生存分析提供了更强大且直观的工具。

  

1 引言

加速失效时间(AFT)模型为生存分析提供了比Cox比例风险模型更具吸引力的替代方案。AFT模型具有可折叠性,其关键效应指标——加速因子——在调整额外协变量时保持不变,且直接在生存时间尺度上提供直观解释。近年来,平滑参数AFT模型的发展暴露出一些应用问题,并提示出多个尚未实现的扩展需求。为此,本研究从多个方面对灵活参数AFT框架进行了改进:采用单调自然样条约束对数累积风险函数为其支撑集上的单调函数;允许时变加速因子,可能包含治愈机制并容纳多个时变效应;同时实现了混合与非混合治愈模型。所有这些扩展均已集成于公开的R包rstpm2中。模拟研究显示,在治愈比例估计方面表现不一,但就协变量效应估计而言,灵活AFT模型即使在高治愈案例存在时也展现出比Cox模型更强的稳健性——无论治愈是否在观测数据期内达到。本文还将部分AFT模型扩展应用于真实世界的生存数据。

AFT模型假定事件时间T与协变量X间满足关系T = T0exp(Xβ),其中T0为基准事件时间。其等价的对数线性形式为log(T) = μ + σW,其中W为随机误差项。AFT模型家族涵盖对数正态、威布尔及广义伽马等分布,具有模型可折叠、可直接诠释时间尺度变化等优势。近年来限制性平均生存时间(RMST)估计备受关注,而AFT模型为直接建模T提供了更简洁的途径。

Cox和Oakes首次提出了时变AFT模型,将基准生存函数定义为S0(∫0t exp[βTX(u)]du),从而引入时变协变量效应。近期研究提出了数值高效的方法,通过对数累积风险函数采用自然样条建模,但该方法被批评无法保证累积风险在整个支撑集上单调递增。本文提出采用单调自然样条予以改进。

实际应用中,常存在部分个体永不发生事件的“治愈”现象。治愈模型通过区分“已治愈”和“未治愈”亚群,增加了估计的复杂性。近期有研究认为AFT模型可能比比例风险模型更适合处理治愈数据。本文旨在引入灵活参数AFT模型的多种扩展,包括Cox-Oakes时变模型、单调自然样条以及混合与非混合治愈模型,并通过模拟评估其在存在治愈情况下的性能,最后将AFT模型应用于合成数据集中。

2 方法

2.1 时变效应的参数化

时变AFT模型由Cox和Oakes定义,其生存函数、累积风险函数和风险函数分别表示为:

S(t|X(u),0≤u≤t) = S0(∫0t exp[βTX(u)]du)

Λ(t|X(u),0≤u≤t) = Λ0(∫0t exp[βTX(u)]du)

h(t|X(u),0≤u≤t) = h0(∫0t exp[βTX(u)]du) exp[βTX(t)]

其中Λ0为基准累积风险函数。本文通过高斯-勒让德积分计算变换时间,并采用自然三次样条对线性预测子建模,从而允许时变加速因子表示为exp(β(t))。

2.2 基准函数的参数化

基准函数通过对数累积风险的线性模型进行参数化,即logΛ0(t) = β0 + ∑βjBj(log t),其中Bj为样条基函数。

2.3 时变协变量与左截断

时变AFT模型要求从时间原点至观测时间的完整协变量历史,左截断数据中该历史通常未知,需对左截断前历史进行强假设方可进行估计。

2.4 对数似然

基于右删失、精确观测和区间删失数据的似然函数被统一表达,其梯度可通过对数风险和累积风险表示。

2.5 单调自然样条与非混合治愈函数

为保证样条估计的累积风险单调,本文采用B样条并施加单调约束。通过QR分解或代数方法求解零空间投影,自然样条可扩展至非混合治愈模型——要求在右边界结点处斜率为零。

2.6 混合治愈模型

混合治愈模型将总体生存函数表示为:

S(t) = π + (1-π)Su(t)

其中π为治愈比例,Su为未治愈者的生存函数。AFT模型用于描述Su,治愈比例π通过logistic模型建模。

3 实现

采用BFGS算法进行优化,使用解析梯度,并通过二次惩罚确保样条和累积时变效应单调递增。模型支持右删失、左截断及多种预测类型,具体实现见于CRAN上的rstpm2包。

4 模拟研究

4.1 设计

模拟研究旨在评估新提出的灵活AFT模型扩展在多种条件下的性能,并与Cox比例风险模型比较。数据生成过程包含四种基准风险类型(三种混合威布尔和一种标准威布尔),治愈比例取0、0.1、0.5和0.9,生成了16种主 scenario。此外还考察了时变加速因子情形(治愈比例0.9)。每个 scenario 生成1000个数据集,样本量10000。

评估指标包括估计偏差、覆盖率、AIC、BIC及收敛率,并计算平均积分平方误差(MISE)比较估计与真实累积风险函数。

4.2 结果

4.2.1 协变量效应估计

AFT模型整体收敛率为83.7%,其中非治愈AFT模型收敛率最高(99.2%),混合治愈模型最低(63%)。在多数 scenario 中,所有AFT模型(无论是否调整治愈)在至少3个自由度下都能较好估计协变量效应,相对偏差控制在18%以内。

AFT模型即使在高治愈比例下未显式建模治愈,仍能可靠估计协变量效应。非治愈AFT模型仅2个自由度时即优于Cox模型,增加自由度可进一步改善拟合。时变 scenario 中,加速因子估计偏差接近0至24%,Cox-Oakes积分模型优于累积尺度模型。

4.2.2 治愈比例估计

混合治愈模型估计治愈比例表现不稳定,非混合治愈模型对高治愈比例(0.5和0.9)估计良好,但对低治愈比例(0.1和0)效果较差。时变 scenario 中,Cox-Oakes积分模型通常更准确估计治愈比例。

4.3 结果评述

灵活AFT模型在足够自由度下,即使未调整治愈,也能很好处理治愈数据,因其样条参数可控制对数累积风险渐近行为,从而准确预测远期生存。混合治愈模型优化面临局部最优难题,不同初始值可能收敛到不同治愈比例,但所得生存估计仍接近真实过程,具实用价值。

5 应用:结肠癌数据集及时变效应

本文使用一个包含15564例患者的合成结肠癌登记数据,演示AFT模型的应用。AFT模型调整性别后预测生存与Kaplan-Meier估计高度一致。进一步调整年龄并引入性别的时变效应后,发现男性可能具有时变加速因子。比较远处转移与非远处转移患者,AFT模型揭示转移组加速因子在随访第一年急剧上升。

调整治愈比例后,混合治愈模型显示远处转移组治愈比例为6.4%,非转移组为41.1%,与既往研究一致。

6 讨论

本文改进并扩展了灵活AFT模型家族,引入单调自然样条、时变加速因子及治愈模型,增强了模型处理真实世界数据的能力。模拟表明,AFT模型即使存在治愈个案,估计协变量效应仍稳健,优于Cox模型。

治愈AFT模型估计治愈比例表现不一,但估计协变量效应良好。样条参数在估计中起关键作用,其优化复杂性可能导致局部最优,但模型仍可提供有用生存估计。

灵活AFT模型最 promising 之处在于其估计协变量效应的稳健性,无论治愈是否存在或是否在观测期内达到。这使AFT模型成为分析生存数据的强大工具。

未来可探索AFT模型在随机效应、惩罚样条、相对生存、竞争风险及多状态模型中的应用,并评估其预测性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号