基于隐马尔可夫模型的整数值自回归机制转换模型:理论、估计与应用

《Econometric Theory》:SWITCHING REGIME INTEGER AUTOREGRESSIONS

【字体: 时间:2025年10月19日 来源:Econometric Theory 1

编辑推荐:

  本文针对计数时间序列常呈现的复杂动态与分布特征,提出了一种将整数值自回归(INAR)模型与隐马尔可夫模型(HMM)相结合的灵活框架——HMM-INAR模型。研究确立了该模型遍历平稳解的存在条件,推导了矩及自协方差函数的闭式解,证明了条件极大似然估计量(MLE)的相合性与渐近正态性,并给出了高效的期望最大化(EM)估计算法。实证以标准普尔存托凭证(SPDR S&P 500)ETF的交易笔数为例,表明该模型不仅能更好地拟合数据,且保留了结果的经济解释性。

  
在金融、经济、气候学和生物学等领域,许多被记录的时间序列本质上是计数数据,例如罕见疾病的感染人数、某只股票在单位时间内的交易笔数、不同城市的武器犯罪记录以及某州每年的飓风数量。传统上,大多数时间序列模型是为连续数据开发的,例如经典的ARMA模型。然而,计数数据的离散特性对这类基于连续变量的模型提出了挑战。直接对原始计数数据进行连续变换再建模,往往无法保证预测值的整数特性,这促使研究者转向为离散随机变量专门设计的统计模型。
近年来,针对整数值时间序列的线性和非线性模型不断涌现。其中,整数值自回归(INAR)模型,由Al-Osh和Alzaid(1987)以及McKenzie(1985)独立提出,使用Steutel和Van Harn(1979)的二项稀疏算子来刻画观测值的自相关性,为分析计数时间序列提供了一个直观的框架。标准的INAR(1)模型将当前时刻的计数值分解为上一时刻的“幸存者”(通过二项稀疏操作)和当前时刻的“新到达者”(创新项)。尽管INAR(1)模型结构简单且易于解释,但其自相关函数模仿了AR(1)过程,在实际应用中可能显得过于局限。虽然可以通过增加滞后阶数(INAR(p))或引入ARFIMA型动态(INARFIMA)来增加灵活性,但这通常会牺牲精确的分布性质,并导致复杂的推断技术。
现实中的计数时间序列,如高频金融交易数据,常常表现出极高的过度离散(方差远大于均值)和复杂的动态模式,例如在低计数状态和高计数状态之间切换。为了在保持INAR模型可解释性的同时,增强其捕捉复杂动态和分布特征的能力,来自奥胡斯大学、帕维亚大学和路易斯大学的Leopoldo Catania、Eduardo Rossi和Paolo Santucci de Magistris合作,在《Econometric Theory》上发表了他们的研究成果“SWITCHING REGIME INTEGER AUTOREGRESSIONS”。他们开发了一个名为HMM-INAR的新颖框架,将隐马尔可夫模型(HMM)的灵活性融入到了INAR(1)的基础结构之中。
这项研究的核心目标是构建一个既灵活又易于解释的模型,能够有效刻画计数时间序列的过度离散性和持续性。具体而言,研究人员通过在INAR(1)模型的两个关键组成部分引入潜在的马尔可夫结构来实现这一目标:一个是控制幸存概率的二项稀疏算子的成功概率(α),另一个是代表新到达者的创新项(ηt)。模型包含两个独立的隐马尔可夫链:{Stα} 支配着α的动态变化,而 {Stη} 则通过一个额外的分类变量Zt,控制着创新项ηt的分布,使其表现为一个动态混合的泊松分布。这种设计使得模型能够捕捉到不同“状态”或“机制”下的动态行为,例如金融市场中由信息到达强度差异所导致的高交易活跃期和低交易活跃期。
为了开展这项研究,作者们主要运用了几个关键技术方法。首先,他们建立了模型的概率基础,通过构建一个等价于原模型的单一隐马尔可夫链 {St},为理论分析提供了便利。其次,在理论推导方面,他们深入研究了HMM-INAR模型的遍历性、平稳性,并成功推导出了其一阶矩、二阶矩以及自协方差函数的解析表达式。第三,在统计推断上,他们基于Douc等人(2004)的成果,严格证明了模型条件极大似然估计量(MLE)的相合性与渐近正态性。第四,为了解决模型估计的计算难题,他们设计了一种高效的期望最大化(EM)算法,该算法的M步(最大化步)具有闭式解,从而实现了MLE的快速计算。最后,在实证分析中,他们利用美国标准普尔500 ETF(SPY)的高频交易笔数数据,对模型进行了估计和验证,并充分考虑了金融数据中存在的强烈日内季节性效应。
模型性质(Properties of the HMM-INAR)
研究首先为HMM-INAR模型设定了完整的前提假设(Assumption 1),确保了模型组成部分的随机特性。通过Lemma 1和Lemma 2,作者证明了等价隐马尔可夫链 {St} 以及联合过程 {(Yt, St)} 的遍历性和平稳性。关键的Theorem 1则进一步确立了 {(Yt, St)} 是几何遍历的,这意味着无论初始值如何,该过程都会以指数级速度收敛到一个唯一的平稳分布。这从理论上保证了模型长期行为的良好性质。
在矩结构方面,Theorem 2提供了模型一阶矩、二阶矩以及自协方差函数的闭式表达式。通过这些表达式,可以清晰地分解过度离散(Index of Dispersion, ID)和自相关(ACF)的来源。分析表明,通过调整隐马尔可夫链的状态数(J, K, L),HMM-INAR模型能够生成丰富多样的动态行为和过度离散程度。例如,仅包含动态α链的模型(HMM(2,1,1)-INAR)其过度离散主要来源于幸存者项At的方差,而仅包含静态泊松混合创新项的模型(HMM(1,2,1)-INAR)其过度离散则主要来自创新项ηt的方差。当引入动态的创新项混合权重(L>1)时,模型还能产生At与ηt之间的协方差,进一步增加了模型的灵活性。自相关函数的分解也显示,具有动态创新项(L>1)的模型能产生比静态混合模型更为复杂的自相关结构。
最大似然估计(Maximum Likelihood Estimation)
在模型估计方面,研究采用条件最大似然法。Theorem 3在适当的识别条件下(Assumption 2)和参数空间紧致性条件下(Assumption 3),建立了条件MLE的强相合性和渐近正态性,并指出样本海塞矩阵几乎必然收敛于Fisher信息矩阵。这为后续的统计推断(如构建置信区间和假设检验)奠定了理论基础。
EM算法与模拟研究(EM Algorithm and Simulation Study)
由于直接数值优化似然函数计算复杂,论文提出了一种高效的EM算法。该算法通过引入一系列示性变量作为潜变量,将完整的对数似然函数分解为多个部分。在E步(期望步),计算这些示性变量在给定观测数据下的条件期望。在M步(最大化步),由于似然函数分解后的各部分对应模型的特定参数(如转移概率矩阵Γ、成功概率α、泊松强度λ、混合权重ω等),其最大值可以以解析形式求出,这大大提高了计算效率。蒙特卡洛模拟结果验证了估计量的有限样本性质良好,即使在中等样本量(T=500)下,偏差和均方根误差(RMSE)也较小,基于渐近正态性的Z检验其经验拒绝频率接近名义水平。
实证说明(Empirical Illustration)
研究人员将HMM-INAR模型应用于标准普尔500 ETF(SPY)在2001年期间的每分钟交易笔数数据。金融交易量是反映信息到达、交易者分歧和市场流动性的关键指标,其时间序列通常表现出极端的分布特征和明显的状态切换行为。实证分析中,为了处理金融数据中强烈的日内季节性(如开盘、午休和收盘时交易活跃度的显著差异)以及隔夜效应,作者对基础HMM-INAR模型进行了扩展,引入了季节性虚拟变量和对开盘时刻稀疏算子的特殊处理。
通过贝叶斯信息准则(BIC)进行模型选择,最优的模型为HMM(4,8,3)-INAR,并包含了81个季节性区间。与其他模型(如标准INAR(1)、混合INAR(Mix-INAR)、仅包含α链或仅包含动态创新项的HMM-INAR变体,以及周期性的负二项Softplus INGARCH(1,1)模型)的比较显示,非限制的HMM(J,K,L)-INAR模型在样本内拟合(通过标准化残差ACF和概率积分变换PIT图判断)和样本外预测(通过中位数绝对预测误差MAFE和预测误差ACF判断)方面均表现最佳。该模型能够很好地捕捉数据的过度离散性和动态持续性,其预测分布也更接近真实数据的分布。
结论(CONCLUSION)
本研究成功地将隐马尔可夫结构引入整数值自回归模型,提出了HMM-INAR这一灵活而强大的框架,用于分析具有高过度离散和持续性的计数时间序列。研究不仅奠定了模型的理论基础(平稳性、矩性质、估计量的大样本性质),还提供了高效的估计算法。实证应用表明,该模型在拟合真实数据和进行预测时优于已有的计数数据模型。HMM-INAR模型的结构本身具有良好的可扩展性,未来可进一步拓展至多元计数时间序列分析、包含更复杂结构(如复合结构)的情形,显示出广阔的研究前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号