面向高频金融数据的稳健高维时变系数估计:RED-LASSO方法及其应用
《Econometric Theory》:ROBUST HIGH-DIMENSIONAL TIME-VARYING COEFFICIENT ESTIMATION
【字体:
大
中
小
】
时间:2025年10月18日
来源:Econometric Theory 1
编辑推荐:
为解决高维高频金融数据中存在的重尾分布、时变系数和维度灾难问题,研究人员提出了一种结合Huber损失、截断技术和?1正则化的RED-LASSO(Robust Thresholding Debiased LASSO)估计方法。该方法能够有效估计时变系数过程并实现积分系数的稳健推断,在理论和实证中均表现出近最优收敛性质,为高频金融建模提供了重要工具。
随着高频金融数据的广泛可获得性,研究人员开发了能够纳入高频数据的金融模型,实证研究表明这些模型能更好地解释市场动态。例如,基于高频测度(如已实现波动率和已实现贝塔估计量)的自回归型模型已被广泛采用。然而,现代金融研究和实践中,研究者发现了大量因子候选,经常面临维度灾难问题。传统的髙维回归方法(如LASSO、SCAD和Dantzig选择器)在稀疏性假设下能处理高维性问题,但直接应用这些方法无法处理贝塔过程的时变特征。此外,高频金融数据往往表现出重尾特性,现有估计方法(包括Kim等(2025)提出的TED估计量)在重尾假设下无法一致估计时变贝塔。
为了解决同时处理重尾观测、维度灾难和时变贝塔过程的需求,Minseok Shin和Donggyu Kim在《Econometric Theory》上发表了题为"Robust High-Dimensional Time-Varying Coefficient Estimation"的研究论文,开发了一种基于高频数据的 novel 高维系数估计程序。
研究人员采用Huber损失和截断方案来处理重尾观测,同时采用?1正则化来克服维度灾难。为了考虑时变系数,他们估计了由于?1正则化而产生偏差的局部系数。在估计积分系数时,提出了去偏方案以利用大数定律特性,并采用阈值方案来进一步适应系数的稀疏性。这种方法被称为稳健阈值去偏LASSO(RED-LASSO)估计量。
研究表明,RED-LASSO估计量能够达到近最优收敛速率。在实证研究中,研究人员将RED-LASSO程序应用于使用高频交易数据的高维积分系数估计,结果表明该方法能够有效处理金融数据的重尾特性并准确捕捉时变系数特征。
关键技术方法包括:采用局部回归估计瞬时系数,使用Huber损失函数处理重尾残差过程,通过截断方法检测协变量过程中的跳跃,运用约束?1最小化(CLIME)估计逆瞬时波动率矩阵,以及通过去偏和阈值方案获得稀疏的积分系数估计。所有分析基于2013-2019年期间的五分钟高频交易数据,包含5个资产和60个因子。
研究人员建立了非参数时间序列回归跳跃扩散模型,其中因变量过程Y(t)和p维协变量过程X(t)都包含连续部分和跳跃部分。系数过程β(t)遵循扩散模型,兴趣参数是积分贝塔∫01β(t)dt,代表协变量过程对因变量过程的平均影响。在回归金融模型中,存在数百个潜在因子候选,因此允许维度p很大,需要处理维度灾难问题。
估计过程分为五个步骤:首先获得瞬时贝塔估计量,使用Huber损失和?1惩罚;其次获得逆瞬时波动率矩阵估计量;然后对瞬时贝塔估计量进行去偏处理;接着获得积分贝塔估计量;最后对积分贝塔估计量进行阈值处理。该方法同时处理了跳跃、重尾性和维度灾难三个问题。
在理论方面,研究证明了在有限(2+ζ)-阶矩条件下,提出的瞬时贝塔估计量具有理想的收敛速率。由于正则化产生的偏差,简单集成瞬时贝塔估计量无法享受大数定律特性,因此提出了去偏方案来获得更快的收敛速率。
模拟研究表明,RED-LASSO估计量在重尾和次高斯过程中都表现最佳。随着样本量n的增加,估计误差减小,且RED-LASSO估计量能够充分解释重尾性,而其他估计量则不能。即使在次高斯过程中,RED-LASSO估计量也优于ED-LASSO估计量,这可能是因为即使使用次高斯随机变量,真实收益过程随时间推移仍可能具有一些极端值。
实证研究应用RED-LASSO估计程序处理2013年1月至2019年12月的高频交易数据。使用5分钟数据来减轻微观结构噪声的影响,选择了五个资产(AAPL、BRK.B、AMZN、GOOG、XOM)和60个因子(54个期货和6个Fama-French因子)。
结果表明,RED-LASSO估计量在所有时期都表现出最佳性能,这主要是因为只有RED-LASSO估计量能够同时处理收益过程的重尾分布和贝塔过程的时变特性。RED-LASSO估计量能够比ED-LASSO、LASSO和SVR估计量更好地解释积分贝塔的稀疏性。
研究发现积分贝塔随时间变化,在大多数时期只有少量因子具有非零积分贝塔。对于BRK.B和XOM,MKT因子发挥了重要作用,MKT因子在所有84个月中都具有非零积分贝塔。相比之下,对于AAPL、AMZN和GOOG,六个因子经常具有零积分贝塔,这可能是因为科技公司近年来在美国市场表现出色,减少了对这些因子的依赖。
本研究开发的RED-LASSO估计程序能够处理金融数据的重尾特性,并考虑高维贝塔过程的时变性和稀疏性。通过采用Huber损失、截断方法和?1惩罚的稳健估计量,能够以理想的收敛速率处理重尾性和维度灾难。通过去偏方案充分减轻了偏差的影响,积分贝塔估计量能够享受大数定律特性。
实证研究表明,RED-LASSO估计程序在R2和贝塔估计的稀疏性方面都表现出最佳性能,表明在估计高维高频设置中的积分贝塔时,RED-LASSO估计方法有助于考虑时变贝塔过程的特点和观测日志收益的重尾分布。
研究还指出了几个未来研究方向:开发具有严格理论保证和实际适用性的稳健调参方法;处理微观结构噪声;以及开发新颖的偏差调整方案来处理积分贝塔推断中不可忽略的偏差项。这些问题的解决将进一步完善高频金融数据的分析方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号