高维函数时间序列的双因子结构预测模型及其在死亡率预测中的应用
《Journal of the Royal Statistical Society Series A: Statistics in Society》:Forecasting high-dimensional functional time series with dual-factor structures
【字体:
大
中
小
】
时间:2025年10月08日
来源:Journal of the Royal Statistical Society Series A: Statistics in Society 1.5
编辑推荐:
本文提出了一种针对高维函数时间序列(HDFTS)的双因子模型,通过分离同质性和异质性特征有效解决了多群体死亡率预测中的维度灾难问题。研究结合函数主成分分析(FPCA)和因子模型技术,在模拟和日本都道府县死亡率数据上验证了模型在点预测和区间预测方面的优越性,为长寿风险管理提供了更精准的保险定价依据。
随着人类预期寿命的持续增长,政府、医疗系统和保险行业面临着日益严峻的长寿风险挑战。准确预测年龄别死亡率对于评估长期财政风险至关重要,然而传统死亡率预测方法如Lee-Carter模型及其扩展仅针对单一群体,容易导致相关群体在长期预测中出现发散结果。虽然协调死亡率预测方法能够同时考虑多个群体,但当群体数量(N)超过观测年份(T)时,传统方法面临"维度灾难"的严峻挑战。
针对这一难题,Chen Tang等研究人员在《Journal of the Royal Statistical Society Series A: Statistics in Society》上发表研究,提出了一种创新的双因子结构模型用于高维函数时间序列(HDFTS)的预测。该模型将高维函数时间序列分解为三个核心组成部分:共同函数载荷(φ(u))、低维矩阵值时间序列(Ft)和群体特定函数载荷(λ(i)(u))。这种分解方式既能保留多个群体的共同特征,又能捕捉每个群体的独特特性。
研究方法上,作者采用了基于长期协方差的函数主成分分析(FPCA)来估计群体特定函数载荷,通过并发函数回归提取共同特征,并利用自互协方差函数估计共同函数载荷。关键技术包括:基于核函数的长期协方差估计、自适应带宽选择、特征值比率准则确定因子数量,以及向量自回归(VAR)模型进行矩阵值时间序列预测。
双因子模型的核心公式可表示为:Yt(i)(u) = φ(u)Ftλ(i)(u) + εt(i)(u)。其中φ(u)为r维共同函数载荷向量,Ft为r×k维矩阵值时间序列,λ(i)(u)为k维群体特定函数载荷向量。该模型通过两步降维策略:首先沿横截面方向将N维HDFTS降至k维函数时间序列,然后沿函数连续体方向进一步降至r维矩阵值时间序列。
蒙特卡洛模拟结果表明,随着样本量T和横截面数量N的增加,模型拟合的均方根误差(RMSE)显著下降。特别值得注意的是,当N > T时模型仍能保持良好性能,证明其处理高维数据的能力。
应用日本47个都道府县1975-2021年的年龄别死亡率数据,研究发现不同地区的死亡率曲线存在明显异质性。如图3所示,东京、长野、京都和大阪的前四个函数因子载荷呈现不同的波峰波谷特征,印证了模型捕捉地区差异的能力。
与传统方法相比,双因子模型在点预测和区间预测方面均表现最优。如表2所示,该模型在1-10步预测中的平均RMSFE为0.710(女性)和1.138(男性),显著低于HDFTS、MFM等方法。区间预测评估使用α=0.2的区间评分规则,进一步验证了模型的优越性。
将死亡率预测结果应用于年金定价发现,基于双因子模型的定价误差仅为每1美元支付0.011美元,而其他方法误差范围为0.016-0.152美元。以5万人、每人年支付1万美元的年金产品计算,使用该模型可为保险公司节省至少250万美元的准备金。
研究结论表明,双因子模型通过有效分离HDFTS中的同质性和异质性特征,不仅解决了高维函数时间序列的预测难题,还为长寿风险管理提供了可靠工具。模型的结构灵活性使其能够涵盖多种现有函数因子模型作为特例,为复杂函数数据的建模和预测开辟了新途径。未来研究可进一步将并发函数回归扩展至函数时间序列回归框架,以更好地捕捉函数观测值的时间依赖性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号