基于广义次序统计量估计Epanechnikov-Weibull分布(EpWD)的参数及其在工程和电子寿命数据中的应用——贝叶斯(Bayesian)与非贝叶斯(non-Bayesian)方法
《Scientific Reports》:Bayesian and non-bayesian approaches for estimating the Epanechnikov-Weibull distribution with applications in engineering and electronics data
编辑推荐:
统计模型虽被广泛认为能有效刻画实际场景,但有时无法在某些情形下实现最优拟合。鉴于此,研究人员研究了Epanechnikov-Weibull分布(EpWD, Epanechnikov-Weibull Distribution)的广义次序统计量(generaliz
统计模型虽被广泛认为能有效刻画实际场景,但有时无法在某些情形下实现最优拟合。鉴于此,研究人员研究了Epanechnikov-Weibull分布(EpWD, Epanechnikov-Weibull Distribution)的广义次序统计量(generalized order statistics, GOSs)。推导了该模型的统计特征,包括矩母函数(moment-generating function, MGF)、第r阶L-矩(rth L-moment)及修剪L-矩(trimmed L-moments)。此外,研究人员采用最大似然估计(maximum likelihood estimation, MLE)和贝叶斯(Bayesian)方法构建了模型参数的估计技术。通过求解Fisher信息矩阵(Fisher information matrix, FIM)的显式表达式构造了渐近置信区间(asymptotic confidence intervals, CIs)。利用Monte Carlo模拟评估了所提估计量在逐次II型删失样本(progressively type-II censored samples)下的有效性。研究人员还分析了该分布的信息论测度——信息熵(extropy)与加权信息熵(weighted extropy)。通过电子与工程数据集的数值算例说明了理论发现的实际应用价值。
论文解读:Epanechnikov-Weibull分布基于广义次序统计量的贝叶斯与非贝叶斯推断及其工程应用
研究背景与动机
经典Weibull分布在可靠性工程中被广泛用于建模寿命数据,但其尾部行为仅由单一形状参数α控制,在面对工程中常见的高偏态或重尾数据时拟合能力有限。广义次序统计量(generalized order statistics, GOSs)为次序统计量、记录值、逐次删失(progressive censoring)等情形提供了统一框架,适合处理可靠性试验中的不完全观测数据。Epanechnikov-Weibull分布(EpWD)通过将具有均方误差最优性的Epanechnikov核(kernel)嵌入Weibull结构,形成两个Weibull型分量的线性组合,兼具所有阶矩存在、信息测度可解析表达等优点。然而此前缺乏基于GOS框架下对EpWD的参数估计、信息测度推导及在逐次II型删失下的系统研究。为此,研究人员在GOS框架下推导EpWD的统计性质、信息熵(extropy)与加权信息熵(weighted extropy, WEX),并基于最大似然估计(MLE)与贝叶斯(Bayesian)方法对其在逐次II型删失样本下进行参数推断,最后用电子器件与工程纤维失效数据验证模型优越性。该论文发表于《Scientific Reports》。
主要关键技术方法
研究人员在GOS框架下推导EpWD的矩母函数(MGF)、r阶L-矩及修剪L-矩(truncated L-moments);推导原始样本及第r个GOS下EpWD的信息熵(extropy, J)与加权信息熵(J(ω),权重w(y)=y)的闭式解;基于逐次II型删失GOS样本分别构建对数似然方程(数值Newton-Raphson求解MLE)与独立Gamma先验下的后验核,采用Metropolis–Hastings(M–H) MCMC算法(12000次迭代,前2000次为预烧期)获得贝叶斯估计;由Fisher信息矩阵(FIM)负二阶期望给出渐近正态协方差阵并依Delta方法构建参数及可靠性函数R(y)、危险率h(y)的渐近置信区间(CIs);设计Monte Carlo模拟(每方案1000次重复)评估不同样本量(n=60,120)、不同观测失效数(m)、不同删失移除概率(p=0.3,0.7)及不同先验下估计量的均方误差(MSE)、平均相对误差(MRE)、平均区间长度(AL)与覆盖率(CP);用两组真实工程寿命数据(电子元件失效时间、纱线疲劳循环数)进行拟合优度比较(AIC、AICc、BIC、HQIC、CAIC及Kolmogorov-Smirnov检验)。
研究结果
广义次序统计量下EpWD的特征结果(Characterization results for the EpWD based on m?GOS)
研究人员在m-GOS框架下推导了EpWD边际分布的矩母函数(MGF)显式级数表达式,并通过对MGF求偏导得到第r个GOS均值与二阶矩的显式公式;取m=0, κ=1退化为普通次序统计量(OSs)并列表验证其性质。进一步结合GOS期望公式导出EpWD的第r阶修剪L-矩(TL-moment)与L-矩显式。验证了MGF在t=0时值为1,并论证了由于Weibull型指数衰减使MGF级数对所有实数t绝对收敛,保证各阶矩存在及FIM有限。
信息熵与加权信息熵测度(Extropy and weighted extropy measures)
研究人员推导了EpWD原始样本的信息熵J(Y)=?1/2∫fY2(y)dy及加权信息熵J(ω)(Y)=?1/2∫y fY2(y)dy的闭式解;进而推广至第r个m-GOS下的J(Y(r,n,m,κ))与J(ω)(Y(r,n,m,κ))。指出加权信息熵因权重y而更敏感于上尾行为,在可靠性中可更好反映晚期失效的不确定性;模拟显示加权信息熵的区间比普通信息熵窄约75%–80%,更易估计。
两种参数估计方法(Two different estimation methods)
给出逐次II型删失GOS样本下EpWD的对数似然函数及α、λ的一阶偏导(得分函数),因无解析解故用Newton-Raphson数值迭代(初值来自矩法,步长回溯、Hessian修正保障收敛,非收敛率<0.5%)。贝叶斯部分设定独立Gamma(a,b)与Gamma(c,d)先验(信息先验Gamma(2,1),无信息先验Gamma(0.001,0.001)),后验无闭式故用M–H抽样获得后验均值(平方误差损失下贝叶斯估计)。给出FIM各元素(Iαα、Iλλ、Iαλ=Iλα)基于观测数据的显式,评估逆矩阵得渐近方差并用Delta方法构参数及R(y)、h(y)的95% CI。详述了逐次II型删失方案(二项移除计数Ri生成算法)及M–H抽样流程(对称正态提议、接受率计算、预烧与有效样本大小诊断)。
模拟研究(Simulation study)
Monte Carlo模拟表明:(1)贝叶斯估计(尤信息先验)MSE低于MLE,在样本小(n=60)或重度删失(p=0.7, m较小)时优势更明显(α的MSE可降低8%–15%),且置信/可信区间覆盖率更接近名义95%;(2)随样本增大(n=120)或删失减轻(p=0.3),三种方法差距缩小但仍保持B.Inf > B.Non-Inf > MLE;(3)加权信息熵J(ω)估计区间显著窄于J,证实其更好估计性;(4)先验敏感性分析显示信息与非信息Gamma先验所得估计差异微小,后验主要由似然驱动;(5)M–H链迹图、Gelman-Rubin <1.05、Geweke及Heidelberger-Welch检验均确认MCMC收敛良好。
实际数据应用(Application of real data)
数据集I为18个电子器件失效时间(h),MLE得a=1.0976, λ?=289.8714;数据集II为25个100cm纱线循环至失效数,MLE得a=1.3375, λ?=288.0086。分别与Exponential-Lindley、Gamma、广义指数(generalized exponential)、Power Lindley、Weibull、Lomax、逆Nadarajah-Haghighi(INH)、逆Lomax、逆Weibull、Chris-Jerry及Rayleigh分布比较,EpWD的AIC、AICc、BIC、HQIC、CAIC最小,Kolmogorov-Smirnov统计量及p值最优,PDF/CDF叠加、Q-Q图均显示最佳拟合。对数据集I在不同逐次删失方案下,贝叶斯法(尤信息先验)给出更窄区间与相近或更高覆盖率;估计的信息熵与加权信息熵符合理论预期,加权信息熵区间更窄。
讨论与结论
研究人员得出结论:本研究在广义次序统计量框架下给出了Epanechnikov-Weibull分布(EpWD)的矩母函数、L-矩、修剪L-矩及信息熵(extropy)与加权信息熵(weighted extropy)的显式表达式;基于逐次II型删失样本分别采用最大似然估计(MLE)与贝叶斯方法(Metropolis–Hastings抽样)进行参数推断,并给出Fisher信息矩阵的显式用以构造渐近置信区间;Monte Carlo模拟表明贝叶斯估计特别在中小样本或重度删失下较MLE偏差与均方误差更小、区间覆盖率更佳,且加权信息熵较普通信息熵更易精确估计;实际电子器件与工程纤维寿命数据拟合显示EpWD优于多种常用寿命分布。EpWD局限性在于不可退化至标准Weibull分布、两分量共用形状参数α限制灵活性、极重尾场合可能不及Pareto或逆Weibull分布。总体而言,EpWD结合GOS框架下的推断方法为工程与电子可靠性中的复杂寿命数据提供了一个具有理论保证和实用价值的替代建模方案。