HGAIT:基于异构图注意力与逆变换模型的相关性感知股票回报预测算法
《Expert Systems with Applications》:HGAIT: Heterogeneous Graph Attention with Inverted Transformers for Correlation-Aware Stock Return Prediction
【字体:
大
中
小
】
时间:2025年08月09日
来源:Expert Systems with Applications 7.5
编辑推荐:
股票回报预测框架HGAIT通过融合Transformer架构、异构图注意力网络和GRU嵌入机制,有效捕捉金融数据的时空依赖与资产间复杂关联,实证显示其显著优于基准方法,尤其在风险调整收益和排序指标上表现优异。
本文提出了一种名为HGAIT的新颖预测框架,旨在显著提升股票收益预测的准确性。HGAIT通过将基于Transformer的架构与异构图注意力网络(Heterogeneous Graph Attention Networks, HGATs)相结合,实现了对金融数据中复杂时间依赖性和变量间关系的深入建模。与传统方法相比,HGAIT引入了更先进的技术,使其在预测性能、风险调整回报以及对市场变化的适应能力方面表现出色。该研究不仅填补了现有模型在处理金融数据结构方面的不足,还通过广泛的实证分析验证了其在实际投资场景中的有效性。
股票收益预测是金融领域研究的核心议题之一,对于投资组合优化、风险管理以及资产配置策略具有重要影响。准确预测股票收益不仅能够帮助机构投资者做出更科学的决策,还能在实际经济活动中创造显著的价值。然而,股票收益具有高度动态性、非线性和相互依赖的特征,使得传统的预测方法难以准确捕捉其变化规律。早期的统计模型,如自回归积分滑动平均(ARIMA)模型,虽然在处理线性、平稳的金融数据方面表现良好,但在面对金融市场固有的波动性和非平稳性时,往往显得力不从心。随着金融数据的复杂性不断上升,机器学习方法逐渐成为主流,因为它们能够更有效地捕捉金融数据中的非线性关系。
传统的机器学习方法,如循环神经网络(RNNs)和卷积神经网络(CNNs),在处理时间序列数据方面具有一定的优势。RNNs能够通过递归结构建模时间序列中的长期依赖关系,而CNNs则通过卷积操作提取局部时间特征。然而,这些方法也存在一定的局限性。RNNs在处理长序列数据时容易出现梯度消失或梯度爆炸的问题,影响模型的稳定性;而CNNs虽然能够并行计算,但在捕捉长期时间依赖关系方面效果有限。为了解决这些问题,Transformer模型应运而生,它通过自注意力机制直接建模长距离依赖关系,从而克服了RNNs在序列处理方面的限制,并显著提高了计算效率。
Transformer模型在自然语言处理(NLP)领域取得了巨大成功,其强大的表示能力也逐渐被应用于金融时间序列预测。然而,现有的基于Transformer的模型在处理多变量时间序列数据时仍然存在一些不足。传统的Transformer模型通常采用固定嵌入策略,难以有效捕捉金融数据中的动态时间特征和变量间关系。为了解决这一问题,近年来的研究提出了多种改进方法,如Crossformer和PatchTST。Crossformer通过多分辨率学习阶段和跨维度注意力机制,有效地捕捉了变量间的相关性;而PatchTST则采用基于块的嵌入方法,增强了局部时间特征的表示能力。此外,一些研究还引入了通道独立性(Channel-Independence, CI)和通道依赖性(Channel-Dependence, CD)策略,以在Transformer模型中实现变量独立性和计算效率之间的平衡。
在这一背景下,本文提出了一种全新的预测框架——异构图注意力与GRU倒置Transformer(Heterogeneous Graph Attention with GRU-Inverted Transformers, HGAIT)。HGAIT不仅继承了iTransformer在时间序列建模方面的优势,还引入了异构图注意力机制,以更全面地建模金融网络中的资产关系。与传统的预测方法相比,HGAIT能够同时捕捉时间序列中的动态特征和资产之间的复杂关系,从而实现更准确的股票收益预测。此外,HGAIT还引入了一种经过正则化的损失函数,该函数结合了均方误差(Mean Squared Error, MSE)和基于皮尔逊相关性的正则化项,从而在提升预测精度的同时,增强了对投资组合管理的适用性。
HGAIT的核心思想在于通过融合GRU结构、Transformer注意力机制和异构图注意力网络,实现对金融数据中时间依赖性和变量间关系的联合建模。在传统的iTransformer模型中,嵌入策略是基于多层感知机(MLP)的,这使得模型在捕捉时间依赖性时存在一定的局限性。HGAIT通过引入GRU结构,改进了变量独立的嵌入方法,使得模型能够更有效地捕捉每个变量的时间依赖性。此外,HGAIT还引入了异构图注意力层,以动态构建资产之间的邻接关系,从而更全面地建模金融网络的结构。这一设计使得HGAIT能够同时学习时间序列中的动态特征和资产之间的结构性关系,从而实现更稳健和具有经济意义的预测结果。
在实验设计方面,本文采用了来自芝加哥大学证券价格研究中心(CRSP)的市场数据,涵盖了从1990年1月到2023年12月的美国市场历史交易数据。数据被按照时间顺序划分为训练集、验证集和测试集,其中训练集覆盖了1995年1月至2009年12月(共180个月),验证集为2010年1月至2011年12月(共24个月),测试集则覆盖了2012年1月至2023年12月。通过使用这些数据,本文对HGAIT的预测能力进行了全面评估,并与多种基准模型进行了对比。评估指标包括Sharpe比率、Sortino比率、最大回撤等,这些指标能够全面衡量模型在风险调整回报和下行风险控制方面的表现。
实证结果表明,HGAIT在多个预测指标上显著优于传统模型。尤其是在基于排名的指标上,如Rank Information Coefficient(RIC)和Rank Information Coefficient Information Ratio(RICIR),HGAIT表现出了更强的预测能力。这表明HGAIT不仅能够准确预测股票收益,还能在投资组合管理中发挥重要作用。此外,HGAIT在不同的市场环境中也表现出良好的适应性。通过分析不同市场阶段(如稳定期、过渡期和高度波动期)的预测表现,本文验证了HGAIT在预测稳定性方面的优势。这表明HGAIT不仅适用于特定的市场环境,还能够在广泛的市场条件下保持良好的预测性能。
HGAIT的另一个重要优势在于其对资产关系的建模能力。传统的预测模型通常将资产视为独立的个体,忽略了资产之间复杂的相互关系。然而,实证研究表明,资产收益之间存在显著的跨相关性,这些相关性由共同的行业归属、宏观经济冲击以及供应链联系等因素驱动。HGAIT通过引入异构图注意力机制,能够有效地建模这些跨资产关系,使得预测结果更加全面和准确。此外,HGAIT还通过消息传递机制,对每个资产的潜在表示进行迭代优化,从而更精确地捕捉资产之间的相互依赖关系。
HGAIT的结构设计使其能够在不同的市场阶段保持良好的预测性能。在高度波动的市场环境中,资产之间的相互关系往往会变得更加紧密,这使得传统的预测模型难以准确捕捉其变化规律。HGAIT通过动态构建资产邻接关系,使得模型能够更灵活地适应市场变化,从而提高预测的稳定性。此外,HGAIT还能够通过消息传递机制,对资产的潜在表示进行迭代优化,使得模型能够更全面地捕捉资产之间的相互依赖关系。
在实际应用方面,HGAIT不仅能够用于股票收益预测,还能广泛应用于投资组合管理、风险控制和资产配置策略。通过引入异构图注意力机制,HGAIT能够更有效地捕捉资产之间的复杂关系,使得投资组合的构建更加科学和合理。此外,HGAIT还能够通过消息传递机制,对资产的潜在表示进行迭代优化,从而提高投资组合的预测能力和风险调整回报。
本文的研究结果表明,HGAIT在多个方面都具有显著优势。首先,HGAIT通过引入GRU结构,改进了传统的嵌入方法,使得模型能够更有效地捕捉时间依赖性。其次,HGAIT通过引入异构图注意力机制,能够更全面地建模资产之间的相互关系。第三,HGAIT通过引入经过正则化的损失函数,使得模型在提升预测精度的同时,也增强了对投资组合管理的适用性。最后,HGAIT在不同的市场阶段表现出良好的适应性,使得其预测结果更加稳健和可靠。
综上所述,HGAIT是一种具有广泛应用前景的预测框架,它通过融合基于Transformer的注意力机制和异构图注意力网络,实现了对金融数据中时间依赖性和变量间关系的深入建模。该框架不仅能够提升股票收益预测的准确性,还能在投资组合管理、风险控制和资产配置策略中发挥重要作用。通过广泛的实证分析,本文验证了HGAIT在多个预测指标上的优势,表明其在实际投资场景中具有重要的应用价值。未来的研究可以进一步探索HGAIT在其他金融领域的应用,如债券市场、外汇市场以及加密货币市场,以验证其在不同市场环境中的适应性和有效性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号