融合增量强化学习与自监督预测的金融交易策略优化研究

【字体: 时间:2025年06月03日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对金融交易中传统深度强化学习(DRL)模型依赖静态数据、难以捕捉市场突变的问题,研究人员提出创新框架IFF-DRL,结合增量学习(EWC)与自监督学习(SSL)预测未来OHLCV数据,生成"日周双频数据"状态空间。实验显示该方法在HSI指数实现103.19%年化收益,为动态市场决策提供未来导向型解决方案。

  

在瞬息万变的金融市场中,人工智能面临的核心挑战是如何实现精准预测与实时决策。尽管金融时间序列建模领域已取得一定进展,但传统模型往往难以应对市场的剧烈波动,导致交易策略失效。问题的根源在于这些模型采用离线训练模式,无法适应实时数据流。与此同时,深度强化学习(DRL)虽在金融决策中展现出潜力,但现有方法普遍存在两大局限:一是仅依赖原始OHLCV(开盘价、最高价、最低价、收盘价、成交量)数据,缺乏对未来趋势的预判;二是忽视政治事件等外部突发因素的影响。这些缺陷使得交易策略在真实市场中容易错失良机或蒙受损失。

为解决这些关键问题,肇庆大学与澳门科技发展基金支持的研究团队在《Expert Systems with Applications》发表创新成果,提出增量预测融合深度强化学习框架(IFF-DRL)。该研究通过整合增量学习与自监督学习技术,使交易模型能够持续适应市场变化并预测未来走势。实验证明,该方法在六大国际股指数据集上显著超越传统策略,其中恒生指数(HSI)年化收益率达103.19%,为高频交易环境提供了兼具适应性与前瞻性的解决方案。

研究采用三项核心技术:1)基于自监督网络AutoConNet的未来N日OHLCV预测;2)在线弹性权重固化(EWC)算法实现增量学习,测试阶段平均降低MSE误差5.93%;3)构建"日周双频数据"状态空间,将预测值与实际观测值融合形成多时间维度特征。实验样本涵盖法国CAC40、韩国KOSPI等六大国际指数,确保模型泛化能力。

【方法创新】提出IFF-DRL框架,首次将SSL与增量学习融入DRL架构。AutoConNet通过对比学习捕捉时间序列依赖关系,EWC算法则通过约束重要参数更新防止灾难性遗忘,二者协同实现模型持续进化。

【数据重构】突破传统OHLCV数据局限,首创"日周双频数据"生成机制。将预测的5日OHLCV均值作为"周数据",与原始日数据拼接形成三维状态空间,使DRL智能体同时把握微观波动与宏观趋势。

【性能验证】采用DDQN、A2C、PPO三种DRL算法验证框架普适性。在六大数据集上全面评估累计收益(CR)、年化收益(AR)、夏普比率(SR)和最大回撤(MDD),结果显示IFF-DRL各项指标均显著优于基线方法,其中夏普比率提升达2.7倍。

【鲁棒性分析】通过增量学习有效缓解概念漂移问题。在线EWC使预测模型持续适应市场分布变化,相比固定参数模型,在突发事件后恢复期缩短40%,证明其对非平稳环境的适应优势。

该研究的突破性在于首次实现金融DRL系统的三重能力跃升:通过SSL挖掘未标注数据中的时序模式,借助增量学习保持模型生命力,利用多尺度状态空间增强决策洞察力。作者Chujin Zhou等指出,这种"预测-适应-决策"的闭环架构,为算法交易系统应对黑天鹅事件提供了新范式。值得注意的是,框架中EWC算法的应用创新性地解决了DRL模型在持续学习中的稳定性-可塑性困境,而AutoConNet的对比预测机制则突破了传统技术指标滞后的瓶颈。

尽管当前研究聚焦单资产交易,但作者强调该框架可扩展至投资组合优化领域。未来工作将探索融入新闻事件嵌入向量,进一步提升模型对突发外部冲击的响应能力。这项研究不仅为智能金融决策系统设立新基准,其核心方法论对医疗时序数据分析、工业设备预测性维护等需要持续学习的动态系统同样具有重要借鉴价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号