面向厚尾数据的增强型截断指数广义分布族:理论构建及其在保险损失建模中的应用
《ASTIN Bulletin: The Journal of the IAA》:Enriched truncated exponentiated generalized family of distributions with application to heavy-tailed data
【字体:
大
中
小
】
时间:2025年12月11日
来源:ASTIN Bulletin: The Journal of the IAA 1.8
编辑推荐:
本文推荐:为解决传统分布在拟合极端保险损失数据时存在的局限性,研究人员开发了一种新的统计分布族——增强型截断指数广义分布族(Enriched Truncated Exponentiated Generalized family, ETE-G)。该研究以对数逻辑分布(log-logistic)为基础构建了三参数子模型ETELL,系统探讨了其统计性质、矩、Fisher信息矩阵及尾部厚度。通过最大似然估计验证参数存在性与唯一性,并应用于挪威火灾保险索赔数据集。结果表明,ETE-G分布族在拟合优度及尾部风险度量(VaR、CTE)方面优于广义帕累托分布(GPD)、指数帕累托分布等经典模型,为厚尾数据建模提供了更灵活的工具。
在保险精算和风险管理领域,准确描述损失数据的分布特征至关重要,尤其是那些罕见但影响巨大的极端事件。传统上,帕累托(Pareto)分布因其能刻画厚尾现象而被视为基准模型,广泛应用于火灾保险、巨灾保险等场景。然而,标准帕累托分布在尾部区域的灵活性不足,难以精准捕捉极端损失,这促使研究者不断寻求其泛化形式。例如,广义帕累托分布(GPD)由Pickands(1975)提出,用于改进极端值的拟合效果;后续还出现了指数帕累托分布、Odd Pareto分布等多种变体。挪威火灾保险索赔数据(1972-1992年)作为一个经典案例,常被用来检验各种厚尾模型的性能。该数据集包含9181条损失记录,起赔点为50万挪威克朗,其数据高度右偏,且含有少量但金额巨大的索赔,传统模型在此类数据上的拟合往往不尽如人意。
针对现有模型的局限,美国中密歇根大学统计、精算与数据科学系的Richard Dankwa和Kahadawala Cooray提出了一种新的分布族——增强型截断指数广义分布族(ETE-G)。该分布族通过截断和指数化增强(Enriching)技术,将任意基线分布(以中位数为截断点)转化为更具弹性的新分布。其核心思想是:首先对基线分布G(x)进行指数化(Exponentiated-G),然后在其中位数θ处进行截断,最后通过参数β(可正可负)实现分布形状的“增强”。由此得到的ETE-G分布族累积分布函数(CDF)和概率密度函数(PDF)形式简洁,其子模型支持从对称、右偏到反J型等多种形态,风险函数(Hazard Function)也可呈现递减、浴盆(bathtub)或倒浴盆(upside-down bathtub)等丰富模式。
研究中重点探讨了一个基于对数逻辑分布(Log-Logistic)的三参数子模型——增强型截断指数化对数逻辑分布(ETELL)。该分布不仅将经典帕累托分布(当β=1时)和Bourguignon等(2016)提出的新帕累托分布(当β=-1时)囊括为特例,更在尾部厚度上表现出显著优势。理论分析表明,ETELL分布是厚尾的,其尾部指数为ξ=1/α,当α较小时,尾部极重,能更好地拟合极端损失。此外,研究还推导了ETELL的分位数函数、模(Unimodality条件为β<-1/α)、矩(仅当k<α时存在)以及香农熵(Shannon Entropy)的解析表达式。
为验证模型实用性,作者将ETE-G家族的多个子模型(包括ETELL、ETEPC(幂柯西分布)、ETELN(对数正态分布)、ETELC(对数柯西分布)、EETEFC(扩展折叠柯西分布)和ETEBS(Birnbaum-Saunders分布))与帕累托、GPD、指数帕累托、Odd帕累托和Beta-帕累托等传统模型一同应用于完整的挪威火灾保险索赔数据(扣除免赔额500后共9020个样本)。拟合优度比较指标包括负对数似然(Negative Log-Likelihood)、AIC、BIC、K-S、A-D和C-M统计量及其模拟p值。
结果显示,ETE-G家族的多个子模型在拟合优度上普遍优于对比模型。其中,基于幂柯西分布的ETEPC模型在AIC、BIC、K-S、A-D和C-M统计量上表现最佳,且其拟合优度检验的p值均超过5%,表明即使对于大样本数据集,该模型也具有出色的整体拟合效果。ETELL和EETEFC模型紧随其后。然而,Q-Q图和log-log生存函数图等图形诊断显示,尽管ETEPC在整体拟合指标上领先,但ETELL在极端上尾部的拟合视觉上更优,尤其能更好地捕捉最高损失值。这提示在 actuarial 应用中,需将全局拟合指标与图形诊断、尾部风险度量结合评估。
风险度量(VaR 和 CTE)的回测(Backtesting)进一步评估了模型尾部的准确性。在2%、1%和0.5%的上尾水平上,ETELL、ETEPC和EETEFC的VaR估计值均能通过二项检验(p值表明可接受原假设),说明其VaR估计是合理的。但对于条件尾部期望(CTE),ETELL模型在三个尾水平上的理论估计与经验估计差异最小(约3%-10%),且t检验的p值表明其CTE估计是可接受的,而ETEPC和EETEFC的CTE估计则出现显著高估。对于保险业而言,轻微高估风险通常比低估更为稳健,因此ETELL在刻画极端损失风险方面展现出其应用价值。
本研究构建的ETE-G分布族为建模厚尾数据提供了强有力的新工具,其理论性质严谨,子模型灵活多样。实证分析表明,该家族模型在处理真实保险损失数据时,尤其在刻画极端尾部风险方面,优于许多现有模型。未来研究方向包括将该框架扩展到更广泛的基线分布,并深化其在不同保险损失数据集中的应用,以进一步提升其实际影响力。
研究采用最大似然估计(MLE)进行参数估计,并证明了估计量的存在性与唯一性(当|β|≤1时)。通过蒙特卡洛模拟(10,000次重复)评估了估计量的性能(偏差、均方根误差RMSE和覆盖概率)。利用Fisher信息矩阵计算标准误。拟合优度检验结合了似然基准则(AIC, BIC)和分布函数基准则(K-S, A-D, C-M统计量及其模拟p值)。风险度量(VaR, CTE)的回测采用二项检验(VaR)和t检验(CTE)进行。应用的挪威火灾保险索赔数据集(1972-1992年,n=9020,起赔点θ=500)是公开的经典厚尾数据集。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号