基于模糊逻辑与自动机器学习的混合方法优化股票价格预测研究

【字体: 时间:2025年07月02日 来源:Expert Systems with Applications 7.5

编辑推荐:

  股票价格预测是时间序列分析领域的重大挑战。研究人员创新性地将模糊时间序列(FTS)与自动机器学习(AutoML)相结合,通过优化模糊分区参数和滞后阶数,构建了分类任务驱动的预测模型。实验证明该方法在多个金融数据集上显著提升预测性能,同时保持模型可解释性,为金融时间序列预测提供了新思路。

  

在金融领域,股票价格预测一直是时间序列分析中最具挑战性的课题之一。传统方法如ARIMA(自回归综合移动平均模型)难以捕捉金融数据的非线性和模糊特征,而模糊时间序列(Fuzzy Time Series, FTS)虽然能处理不确定性,但存在参数选择依赖经验、滞后阶数固定等局限性。随着机器学习技术的发展,如何将FTS与现代算法有机结合,在提升预测精度的同时保持模型可解释性,成为学术界和业界的共同难题。

为突破这些技术瓶颈,研究人员开展了一项创新性研究,成果发表在《Expert Systems with Applications》。该研究首次将自动机器学习(AutoML)技术引入FTS建模过程,通过构建混合预测框架,实现了模糊分区参数和滞后阶数的自动化优化。研究团队采用TPOT(基于树的管道优化工具)和MLP(多层感知机)两种AutoML方案,将预测问题重构为分类任务,利用百分比差分转换确保数据平稳性,并创新性地提取了模糊集隶属度、位置特征等关键指标。

关键技术方法包括:1)基于贝叶斯优化的超参数搜索确定最优模糊集数量和类型;2)采用三角、余弦和高斯三种隶属函数进行数据模糊化;3)通过最大t-协范式聚合模糊化数据;4)构建包含滞后特征的三维输入空间(类别、隶属度、位置标志);5)使用校准分类器优化预测概率。实验数据涵盖Hénon映射和Lorenz混沌系统,以及上海股市、TAIEX指数等真实金融数据集。

研究结果部分显示:

  1. 混沌时间序列预测:在Hénon数据集上,网格搜索法配置的模型MSE(均方误差)达1.328×10-3,优于传统RBF(径向基函数)模型的2.080×10-3;Lorenz系统中TPOT模型RMSE(均方根误差)仅0.00417,显著低于KBLCCG算法的0.0686。
  2. 金融数据集表现:上海月度数据预测MAE(平均绝对误差)降至448.34,较BPNN(反向传播神经网络)基准提升33.7%;TAIEX数据集在2010-2019年间,XGBoost模型在8个年份超越FTS-AP-SVR基准。
  3. 多变量预测验证:土耳其里拉汇率预测中,USD/TRY组合2015年RMSE达0.0229,优于FF-ANN-PSO的0.0266;但GBP/TRY组合表现波动较大,显示模型对某些货币对的适应性有待提升。

研究结论指出,该方法通过AutoML自动化优化过程,解决了传统FTS模型参数选择的主观性问题。创新性地将回归问题转化为分类任务,既保留了模糊逻辑的可解释优势,又融入了机器学习的高精度特性。特别是提出的特征工程方案,能够捕捉时间序列在模糊空间的细粒度特征,而基于逻辑连接的聚合方式确保了规则可追溯性。在金融预测领域,这种"白盒"特性对风险管理和投资决策具有重要意义。未来研究可向自适应模糊分区、深度模糊网络等方向拓展,进一步提升对非平稳金融数据的建模能力。

该研究的核心价值在于建立了模糊理论与AutoML的协同框架,为处理具有不确定性的时间序列预测问题提供了标准化解决方案。相比现有文献,其技术突破主要体现在三方面:首次应用AutoML优化FTS参数、创新性地采用分类任务重构预测问题、系统性地开发了兼顾精度与解释性的特征工程方案。这些成果不仅适用于金融领域,对医疗、能源等需要处理模糊信息的预测场景也具有重要参考价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号