幂Lindley-X分布:一种新的寿命分布模型及其在生存分析中的应用

《Mathematical and Computational Applications》:Modeling Diverse Hazard Shapes with the Power Length-Biased XLindley Distribution

【字体: 时间:2025年12月25日 来源:Mathematical and Computational Applications 2.1

编辑推荐:

  本文推荐一种新型两参数寿命分布——幂Lindley-X分布(PLXL),该模型在经典Lindley分布基础上引入幂参数,显著提升了模型灵活性。文章系统推导了PLXL分布的概率密度函数(PDF)、风险函数(HRF)的数学性质(如单峰性、倒浴盆形等),采用最大似然估计(MLE)和最小二乘估计(LSE)进行参数拟合,并通过蒙特卡罗模拟验证了MLE的优越性。实证分析表明,PLXL分布在拟合COVID-19疫苗接种率、碳纤维应力及膀胱癌患者缓解时间等真实数据时,其AIC/BIC值均优于Gamma、Weibull、指数化指数(EE)等传统分布,凸显了其在生物统计与可靠性工程中的应用潜力。

  

引言

幂Lindley-X分布(PLXL)是在经典Lindley分布基础上通过引入幂变换构造的新型两参数寿命分布。Lindley分布因其在建模单调风险函数数据时的局限性,促使研究者开发其广义形式。PLXL分布通过参数λ和θ的调控,能够适应更复杂的寿命数据模式,特别是在生物医学和可靠性工程中常见的非单调风险形态。

分布函数与基本性质

PLXL分布的概率密度函数(PDF)定义为:
f(x) = (λθ3/ (θ2+2θ+2)) xλ-1(2+θ+xλ) e-θxλ, x>0, λ>0, θ>0
其累积分布函数(CDF)具有显式表达式:
F(x) = 1 - [e-θxλ/ (θ2+2θ+2)] [θ2x+ (θ3+2θ2+2θ)xλ+ (θ2+2θ+2)]
这种封闭形式便于处理删失数据。生存函数(SF)自然由S(x)=1-F(x)给出。

概率密度函数的形状分析

通过研究PDF的一阶导数,发现其形状由参数λ和θ共同决定:
  • 当0<λ≤1 3, θ>0 或 1/3<λ<1 2, θ≥√(2λ (1-λ))-1>
  • 当λ>1/2, θ>0 时,PDF呈单峰形态。
    这种灵活性使PLXL能够拟合右偏、左偏等多种数据分布。图示通过参数组合(如λ=0.4, θ=0.2的递减PDF;λ=1, θ=0.5的单峰PDF)直观展示了这一特性。

风险函数的变化特征

风险函数(HRF)是生存分析的核心:
h(x) = [λθ3x2λ-1(2+θ+xλ)] / [θ2x+ (θ3+2θ2+2θ)xλ+ (θ2+2θ+2)]
其形状可通过研究导数符号变化进行分类:
  1. 1.
    递增型HRF:当λ≥1, θ>0 时,风险随时间持续上升;
  2. 2.
    递减型HRF:当0<λ≤1 3, θ>0 等条件下,风险逐渐降低;
  3. 3.
    倒浴盆型(IBT):当1/3<λ<1 2,><θ<√(2λ (1-λ))-1>
  4. 4.
    递减-递增-递减型:特定参数区间下出现更复杂的非单调形态。
    总时间检验(TTT)图被用于辅助判断HRF形状,凸-凹形态对应IBT,凹-凸对应浴盆形。

矩与模拟生成

PLXL分布的r阶原点矩可解析表示为:
E(Xr) = [Γ((2λ+r)/λ) (r+(θ2+2θ+2)λ)] / [λθr/λ2+2θ+2)]
其中Γ(·)为Gamma函数。该表达式便于计算均值、方差等数字特征。
随机数生成采用混合分布法:以概率p=(θ2+2θ)/(θ2+2θ+2)从广义Gamma分布GG(2,λ,θ)抽样,以概率1-p从GG(3,λ,θ)抽样,结合均匀分布判定实现高效模拟。

参数估计与模拟比较

采用最大似然估计(MLE)和最小二乘估计(LSE)进行参数拟合。对数似然函数为:
ln L = n ln(λθ3/(θ2+2θ+2)) - θ∑xiλ+ ∑ln(2+θ+xiλ)
通过求解得分函数方程组获得MLE。LSE通过最小化∑[F(x(i))-i/(n+1)]2得到。
蒙特卡罗模拟(N=10,000次)显示:
  • MLE的均方误差(MSE)普遍低于LSE;
  • 随着样本量n(20, 50, 100, 150)增大,两种估计的MSE均下降,且差异缩小;
  • MLE在中小样本下更具优势,大样本时两者渐近等价。

实证分析

完全数据建模

数据集1(46国COVID-19疫苗接种率):TTT图显示递减型HRF。PLXL的拟合优度(K-S检验p值0.923)显著优于Gamma、Weibull等分布,其AIC(127.3)、BIC(131.0)均为最低。
数据集2(69个碳纤维失效应力):HRF呈递增型。PLXL的K-S统计量(0.042)远小于对比模型,再次确认其优越性。
残差QQ图与直方图显示PLXL能很好地捕捉数据分布特征。

删失数据建模

数据集3(139例膀胱癌患者缓解时间,含右删失):TTT图表明HRF呈倒浴盆形。PLXL与广义逆指数(GIE)、逆Gamma(IG)、逆Weibull(IW)、逆幂Lindley(IPL)、对数正态(LN)、Lindley-指数(LE)等分布比较,其AIC(540.2)和BIC(546.1)均为最优,证实其对复杂生存模式的适应能力。

结论

幂Lindley-X分布通过简单的函数结构实现了对风险函数多种形态的灵活拟合,其参数估计稳定,计算效率高。在生物医学(疾病缓解时间)、材料科学(纤维强度)及公共卫生(疫苗接种)等领域的实证表明,PLXL较传统分布具有明显优势。未来工作可拓展至多元PLXL分布、回归模型及更复杂的删失数据处理框架,进一步扩大其在生存分析中的应用范围。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号