柔性Lomax-G分布族:在水文学与生物医学中的估计方法与应用创新研究
【字体:
大
中
小
】
时间:2025年09月30日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对传统Lomax分布在复杂数据建模中的局限性,提出新型柔性Lomax-G(NLx-G)分布族,通过引入T-X生成器构建包含双参数的全新概率模型。研究系统推导了该分布族的量化函数、混合表示与矩特性,并通过最大似然估计等六种方法验证参数估计有效性。模拟分析与三组真实数据(洪水水位、豚鼠生存期、失业保险记录)的应用表明,其子模型NLx-指数分布(NLxEx)在拟合优度检验中显著优于现有指数型分布,为水文学、生物医学及保险领域的复杂数据建模提供强鲁棒性工具。
在统计学与数据建模领域,传统概率分布常难以适应复杂现实数据的多样形态,尤其是水文学中的极端洪水事件、生物医学中的生存时间数据以及保险领域的风险记录,往往呈现右偏、双峰或多模态特性。帕累托II型分布(即Lomax分布)虽在经济学、精算学及可靠性工程中广泛应用,但其形态单一性限制了在复杂场景下的拟合能力。尽管已有加权Lomax、 transmuted Lomax、指数化Lomax等多种改进版本,仍缺乏一个兼具数学简洁性与形态泛化能力的统一框架。
为此,来自巴基斯坦政府Makhdoom shames-u-deen Gillani联合学院、沙特努拉公主大学、沙特国王 Abdulaziz大学、埃及Benha大学等多机构的研究团队,在《Scientific Reports》上发表了题为“The flexible Lomax-G family with estimation methods and applications in hydrology and biomedicine”的研究论文,提出了全新Lomax-G分布族(NLx-G),通过T-X家族生成器与函数H(Π;y,?)=G(x;ψ)(2?G(x;ψ))/Gˉ(x;ψ)的融合,构建了包含两个额外形状参数(α, β)的泛化概率结构。该分布族不仅具备闭合形式的概率密度函数(PDF)与累积分布函数(CDF),还能生成右偏、左偏、对称、双峰、J形、反J形等多样密度形态,以及递增、递减、浴盆、修正浴盆等多种风险率(hazard rate)模式,显著提升了其对复杂数据的适应性。
研究采用的最大似然估计(ML)、最小二乘(LS)、Cramér-von Mises(CVM)、加权最小二乘(WLS)、Anderson-Darling(AD)与右尾Anderson-Darling(RTAD)六种参数估计方法,在大量模拟分析中验证了估计量的一致性与有效性。其中最大似然估计在均方误差(MSE)准则下表现最优,而RTAD方法在小样本场景下展现较强鲁棒性。
关键方法上,作者通过系列展开与代数重构,将NLx-G的CDF与PDF转化为指数化基线分布(exp-G)的线性组合,进而推导出矩生成函数(MGF)、残差寿命矩、反向残差寿命矩等核心性质。三组真实数据(33例洪水水位记录、72例豚鼠结核菌感染生存时间、58例美国马里兰州失业保险月度记录)被用于验证NLx-指数分布(NLxEx)的实践性能,并通过负对数似然(-?)、AIC(Akaike信息准则)、BIC(贝叶斯信息准则)、KS检验(Kolmogorov-Smirnov检验)等指标,与Lomax指数(LEx)、指数化 transmuted 指数(ETLEx)、指数化Gumbel指数(EGEx)、Burr XII指数(BXIIEx)、transmuted广义指数(TGEx)、Topp-Leone奇对数逻辑指数(TLOLLEx)等六种现有模型进行对比。
通过二项展开与指数化基线分布重构,NLx-G的CDF可表示为F(x)=∑i,k∞ai,kG(x)i+k,PDF为f(x)=∑i,k∞di,khi+k?1(x),其中hi+k?1(x)为幂参数i+k?1的exp-G密度函数。该表示为矩与生成函数的推导奠定基础。
第r阶原点矩μr′=∑i,k∞di,kE(Yi+k?1r),其中Yi+k?1为exp-G随机变量。通过该式计算出NLxEx分布的前四阶矩、方差、偏度(Ω1)、峰度(Ω2)与变异系数(CV),数值模拟表明参数变化可灵活调节分布形态。矩生成函数(MGF)亦有两种表达:一为基于exp-G的MGF组合,二为通过量化函数QG(u)的积分形式。
第s阶不完全矩Is(t)=∑i,k∞di,k∫0txshi+k?1(x)dx,用于计算平均偏差δ1与δ2、Bonferroni曲线与Lorenz曲线,在经济与保险风险分析中具有实用价值。
定义残差寿命矩an(t)=E[(X?t)n∣X>t]与反向残差寿命矩An(t)=E[(t?X)n∣X≤t],分别用于可靠性工程与生存分析中的风险时序评估。
模拟研究涵盖15组参数组合与5种样本量(n=50,100,200,500,750),重复1000次。结果表明所有估计方法均具有一致性(MSE随样本量增加而降低),但最大似然估计在绝大多数场景下均方误差最小,RTAD方法在小样本时表现稳定。收敛性分析指出LS、WLS、CVM与AD方法在偏态或厚尾数据中可能出现有限样本波动。
在洪水数据中,NLxEx的AIC(155.2)、BIC(159.8)、KS统计量(0.099)均优于对比模型;豚鼠生存数据中,其W(0.042)与A(0.287)均为最低;保险数据中,NLxEx的CAIC(423.1)与HQIC(418.6)表明其参数效率最高。拟合曲线与分位数-分位数(QQ)图一致显示NLxEx对经验分布的良好捕捉能力。
研究结论强调,NLx-G分布族通过数学扩展与参数化灵活性,突破了传统Lomax分布的应用边界。其子模型NLxEx在多种现实场景中均展现最优拟合性能,且最大似然估计为其参数推断提供了可靠工具。该框架为水文学、生物医学、保险数学等领域的复杂数据建模提供了统一且强大的解决方案,未来可进一步扩展至贝叶斯推断、回归结构及多变量建模中。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号