重塑帕累托:适用于所有损失(无论大小)的分布拟合新框架
《British Actuarial Journal》:Reinventing Pareto: fits for all losses, small and large
【字体:
大
中
小
】
时间:2025年11月22日
来源:British Actuarial Journal
编辑推荐:
本文针对保险损失分布拟合中“小损失与巨灾风险难以兼顾”的行业难题,由Michael Fackler开展了对帕累托(Pareto)模型及其与对数正态(Lognormal)等分布拼接(Splicing)的系统性研究。研究构建了一个包含广义帕累托分布(GPD)尾部、参数直观可解释的通用模型框架,该框架统一并扩展了多种现有方法,并为传统的Riebesell(幂曲线)暴露评级法提供了新的理论见解,对稀缺数据下的精算建模具有重要实践意义。
在保险精算领域,一个长期存在的困境是如何用一个统一的模型来准确描述从频繁发生的小额损失到极其罕见但破坏性巨大的“黑天鹅”事件。传统的分布模型似乎总是“鱼与熊掌不可兼得”:专注于拟合中小损失的分布(如对数正态分布Lognormal)往往低估了极端事件的概率,其“尾巴”不够“厚”;而能很好捕捉巨灾风险的分布(如帕累托分布Pareto)在描述中小损失时又显得力不从心,形状与现实不符。随着现代风险管理日益强调全面性(Holistic Risk Management)和资本建模(Capital Modelling)的精确性,以及再保险层(Reinsurance Layer)和高免赔额(Deductible)保单定价的需求,构建一个能够在整个损失规模范围内(From the many smaller to the very few large ones)都保持准确性的“全模型”(Full Model)变得至关重要。
为了攻克这一难题,发表在《British Actuarial Journal》上的这项研究,由来自德国慕尼黑的精算师Michael Fackler主导,对帕累托分布家族进行了彻底的“重塑”。研究的核心思想是采用“拼接”(Splicing)技术,将描述中小损失的“主体”(Body)分布(如熟悉的Lognormal)与描述极端损失的“尾部”(Tail)分布(如Pareto或GPD)巧妙地连接起来,从而创造出一种“初看像Lognormal,实则拥有Pareto尾部”的混合分布。这项研究不仅系统性地梳理和分类了现有的各种拼接分布,还提出了一个更通用的框架,并特别注重分布函数的几何直观性和参数的可解释性,这有助于在数据稀缺(Scarce Data)的情况下进行更稳健的参数推断。
研究人员为开展此项研究,主要运用了以下几个关键方法:首先,构建了一个系统的分类框架,对以帕累托(Pareto)或广义帕累托分布(GPD)为尾部的拼接分布进行统一描述和比较。其次,重点采用了“阈值优先”(Threshold-first)的参数推断方法,即先确定尾部开始的阈值θ,再分别拟合主体和尾部的分布参数,这相较于复杂的“一体化”(All-in-one)极大似然估计,在实践操作中更为简便可靠。此外,研究深入探讨了分布拼接时的平滑度(Smoothness)条件(如C0连续、C1连续pdf、C2连续等)对模型复杂度和灵活性的影响。最后,将发展的新框架应用于重新审视和阐释传统的Riebesell暴露评级方法。
一、 帕累托:再保险公司的“旧爱”
文章开篇肯定了单参数帕累托分布在再保险定价中的“标准模型”地位。其核心魅力在于尾部建模时的“记忆缺失”特性(Memoryless Property):当阈值d提高时,条件分布依然保持帕累托形式,且形状参数α不变。这意味着再保险公司可以比较不同报告阈值下的数据,并可能得出某些业务领域的α“市场基准值”,使得参数α变得可解释(Interpretable)。文章还回顾了基于帕累托模型的频率外推(Pareto extrapolation equation for frequencies)和层保费(Layer risk premiums)计算公式,为后续推广奠定基础。
二、 广义帕累托(GPD):新的“挚爱”?
研究随后将目光投向更灵活的广义帕累托分布(GPD)。通过Scollnik (2007)提出的参数变换(α=1/ξ>0, λ=ατ-θ),将标准的GPD生存函数重新参数化为 F(x|X>θ) = ((θ+λ)/(x+λ))α。这种形式清晰地揭示了GPD与帕累托的关系:GPD本质上是帕累托分布在x轴上平移了λ个单位。更重要的是,该参数化使得参数α和λ在阈值变化时同样保持不变,继承了帕累托模型的优良特性,同时通过λ提供了额外的灵活性,可以描述局部帕累托α(Local Pareto Alpha, αx)随损失规模变化的趋势(递增、恒定或递减)。文章详细分析了GPD的整个参数空间(包括ξ<0的有界损失情况),并指出对于保险损失建模,最合理的参数区域是0<>
三、 分布变体的构建
为了获得更大的灵活性,文章探讨了通过右截断(Right Truncation)或右删失(Right Censoring)来处理存在最大损失(Max)的情况,并介绍了如Lomax(即双参数帕累托)和Burr等作为基础全模型。然后重点阐述了构建拼接分布的两大技术:混合(Mixing)和拼接(Splicing)。文章特别强调了在定义拼接分布时,使用生存函数(Survival Function)比使用概率密度函数(PDF)更具几何直观性,并明确区分了“适当主体”(Proper Body,即r = F1(θ))和“广义主体”(General Body Weight)两种情形,指出前者能保证主体部分的分布形状与原分布一致,参数更易于解释和比较。
四、 对数正态-帕累托(LN-GPD)模型世界
这是文章的核心原创性研究部分。作者提出了一个通用的六参数LN-GPD-0模型,并通过施加三种约束(尾部设为帕累托、主体设为适当主体、要求一定的平滑度C1, C2...),构建了一个层次分明(部分有序集)的模型家族。
研究将文献中已有的重要模型置于该框架内进行定位和比较。例如,Knecht & Küttel (2003)提出的Czeledin分布对应于pLN-Par-1(适当主体、帕累托尾、C1连续PDF),而Scollnik (2007)提出的第二复合对数正态-帕累托模型则对应于LN-Par-2(广义主体、帕累托尾、C2连续)。文章通过严谨的数学推导证明,pLN-Par-1和LN-Par-2是本质不同的模型:若想以C2的平滑方式将帕累托尾部连接到对数正态曲线,主体部分的概率权重r必须小于适当主体情况下的权重(r < Φθ),即需要“扭曲”主体分布,赋予尾部更多权重。这揭示了模型选择背后深刻的几何含义。
五、 变体与应用
文章综述了其他主体分布(如Weibull, Gamma, Exponential, Power Function等)与GPD尾部拼接的模型,并提及了如Grun & Miljkovic (2019)对超过250种拼接模型进行大规模比较的研究。在此基础上,作者对参数推断的两种路径(All-in-one vs. Threshold-first)和模型复杂性(参数数量)之间的权衡(Trade-off)进行了深入讨论。指出平滑模型(如C2)参数较少,便于“一体化”估计,但可能过度约束了主体和尾部的独立性;而非平滑的C0模型配合“阈值优先”法,虽然参数较多,但推断更简单,且参数(尤其是适当主体模型的参数)更具可解释性,在数据来自不同来源时尤其有用。
六、 重新审视古老的暴露评级方法
作为理论框架的应用,文章重新审视了精算学中著名的Riebesell(幂曲线)模型。该模型规定:责任险保单的限额(Limit)翻倍时,风险保费(Risk Premium)按一个固定比例z(称为翻倍限额附加率DLS)增加。研究证明,这一经验法则等价于其背后的损失严重度分布必须具有一个形状参数α = 1 - ld(1+z) < 1的帕累托尾部,且该尾部起始阈值θ处的主体分布权重r必须满足α ≤ r < 1的条件。研究构造了一个具体的连续C0幂函数-帕累托(Pow-Par-0)模型作为Riebesell分布的例子,并详细分析了其几何特征。
研究表明,Riebesell规则的成功应用依赖于一个相对狭窄的参数条件,并非一个可以随意使用的单参数模型。这为理解该传统方法的适用性和局限性提供了新的理论依据。
本研究通过对帕累托分布家族进行系统的“重塑”,构建了一个强大而直观的拼接分布框架。其重要意义在于:首先,它为解决保险精算中长期存在的“大小损失拟合难两全”的问题提供了统一且灵活的理论与实践方案。其次,它特别强调参数的可解释性(Interpretable Parameters)和几何直观性,这在数据稀缺的实际工作中至关重要,使精算师能够结合市场经验(Market Experience)来验证和约束模型参数,提高模型的可靠性和实用性。最后,该框架不仅涵盖和厘清了大量现有模型,还为传统的暴露评级方法提供了新的理论视角,展现了强大的包容性和洞察力。这项研究无疑将激励精算从业者更自信地采用复杂的分布模型,从而在日益复杂的风险环境中做出更准确的评估和决策。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号