基于LSTM与FEDformer融合架构并集成情感分析的加密货币价格预测模型研究
《IEEE Access》:Cryptocurrency Price Prediction Using LSTM and FEDformer Enhanced by Sentiment Analysis
【字体:
大
中
小
】
时间:2025年12月16日
来源:IEEE Access 3.6
编辑推荐:
本文针对加密货币价格波动剧烈、传统预测模型难以有效捕捉其非线性特征及长短期依赖关系的问题,提出了一种名为L-FED的新型混合深度学习模型。该模型通过并行集成长短期记忆网络(LSTM)与频率增强分解Transformer(FEDformer),并结合基于CryptoBERT的情感分析技术,构建了包含历史交易数据、技术指标与情感特征的综合特征集。实验结果表明,L-FED在比特币和以太坊数据集上的预测精度显著优于现有基线模型,其中RMSE和MAPE指标分别提升16%/12.8%(比特币)和11.6%/6.4%(以太坊),且情感分析使预测准确率进一步提升19%和2.9%。本研究为高频波动金融时间序列预测提供了创新性解决方案,对量化投资与风险管理具有重要实践意义。
在金融科技浪潮的推动下,加密货币已成为全球金融市场中不可忽视的力量。比特币和以太坊等去中心化数字货币凭借其去中心化、高流动性和交易便捷性,不仅挑战着传统跨境支付体系,更逐渐成为一种独立的资产类别。然而,加密货币市场最显著的特征之一就是其极端的价格波动性。以比特币为例,其价格在2013年从13美元飙升至1100美元,涨幅高达8360%;2021年初又从29000美元暴涨至64000美元,随后又跌至30000美元左右。这种剧烈波动使得加密货币交易充满投机性,也给市场参与者带来了巨大的风险。
这种价格波动背后的驱动因素极为复杂,既包括市场供需关系、宏观经济环境、监管政策变化、技术创新等传统因素,也受到社交媒体情绪、突发事件等非传统因素的显著影响。更棘手的是,加密货币市场全天候连续交易,没有开盘收盘时间,价格波动呈现出高度的非线性和非平稳特性。传统的经济计量模型(如ARIMA、GARCH)在捕捉这种复杂动态时显得力不从心,而传统的机器学习方法虽然能够处理非线性关系,但在捕捉时间序列的长期依赖关系方面存在局限。
为了突破这些限制,Sumin Li、Rentao Wang、Yudong Wan和Jincheng Hu等研究人员在《IEEE Access》上发表了一项创新性研究,提出了一种名为L-FED的混合深度学习模型。该模型巧妙地将擅长捕捉局部时间依赖关系的LSTM网络与能够有效提取全局频率域特征的FEDformer相结合,并通过集成情感分析技术,构建了一个全面而强大的加密货币价格预测框架。
研究人员采用了几项关键技术方法:首先,他们设计了一个并行架构,使LSTM和FEDformer能够进行双向信息交互,实现局部-全局协同学习;其次,他们开发了综合特征工程方法,整合了历史价格数据、六种技术指标(包括SMA、EMA、布林带和RSI)以及四种情感分析模型(VADER、TextBlob、FinBERT和CryptoBERT)生成的情感特征;此外,他们还引入了由LSTM生成的"短期指导价格"作为FEDformer的增强输入特征;最后,通过注意力融合机制将两个子模型的输出进行有效集成。实验使用了从2020年2月至2025年3月的比特币和以太坊日交易数据,以及从CryptoNews平台爬取的超过5000条新闻文本作为情感分析的数据源。
L-FED模型的核心创新在于其并行混合架构。该架构包含三个主要组成部分:数据预处理模块、并行处理模块(LSTM和FEDformer子模型)以及特征融合与预测模块。
LSTM组件专门负责捕捉短期波动和局部依赖关系。其内部的门控机制(包括遗忘门、输入门和输出门)能够选择性保留或丢弃信息,有效解决了传统循环神经网络(RNN)中的梯度消失或爆炸问题。在具体实现中,研究人员采用了双向LSTM(BiLSTM)结构,包含2个隐藏层,隐藏层维度为128,并设置了0.1的dropout率以防止过拟合。
FEDformer组件则专注于提取长期趋势和全局特征。其核心创新在于频率域学习机制——通过傅里叶变换将时间序列数据转换到频率域,然后利用随机采样策略选择关键频率成分进行学习,显著降低了计算复杂度(从O(N2)降至O(N))。模型采用混合专家分解块将输入序列分解为季节性和趋势成分,其中趋势成分被丢弃,仅保留季节性成分进行深层学习。
情感分析在加密货币价格预测中扮演着关键角色。研究人员比较了四种不同的情感分析方法:基于规则的VADER、传统统计方法的TextBlob、通用深度学习模型FinBERT以及专门针对加密货币领域训练的CryptoBERT。
实验结果表明,领域特定的CryptoBERT表现最优,在比特币和以太坊数据集上分别将预测误差降低了22%和2.9%。这是因为CryptoBERT在加密货币相关的语料上进行了专门训练,能够更准确地理解该领域的专业术语和情感表达。情感分数的计算公式为:整体情感分数 = Σ(ωi× 情感分数i)/Σωi,其中权重ωi基于文章的重要性、来源可信度或时效性确定。
在比特币和以太坊数据集上的实验结果表明,L-FED模型在所有评估指标上均显著优于基线模型。在比特币预测中,L-FED的RMSE为1770,MAPE为1.90%,R2达到0.9874;在以太坊预测中,相应指标分别为105.4、2.64%和0.9482。
与单一模型相比,L-FED相比独立LSTM模型在RMSE指标上提升了17.9%(比特币)和20.2%(以太坊),相比独立FEDformer模型提升了21.7%和11.2%。与现有混合模型(如CNN-LSTM和LSTM-Informer)相比,性能提升分别为16-31.4%。这些结果验证了并行混合架构的有效性。
研究人员还进行了投资回测实验,比较了基于L-FED预测结果的两种投资策略:动态阈值策略和跨货币套利策略。回测结果显示,在6个月的投资期内,初始资金10000美元,跨货币套利策略最终资金达到15048.59美元,总收益率50.49%,显著优于动态阈值策略的12.96%收益率。
本研究提出的L-FED混合模型通过创新性地结合LSTM的短期记忆能力和FEDformer的全局频率域分析优势,有效解决了加密货币价格预测中的关键挑战。综合特征工程的引入,特别是领域特定的情感分析,显著提升了模型对市场动态的理解能力。
该研究的主要贡献包括:第一,提出了一个新颖的并行混合架构,实现了局部与全局特征的双向交互学习;第二,开发了针对加密货币预测的综合特征工程方法,系统整合了多源信息;第三,通过定量分析证明了领域适应情感分析在金融预测中的重要性。
这项研究不仅为加密货币价格预测提供了新的技术解决方案,也为更广泛的金融时间序列预测研究提供了重要参考。未来研究方向包括集成高频交易数据、开发动态情感加权策略以及探索多模态深度学习架构,进一步提升预测精度和实用性。
该研究的代码和数据集已公开在https://github.com/lsm-2024/L-FED,为后续研究提供了宝贵的资源基础。随着数字货币市场的持续发展,此类先进预测模型将在风险管理、投资决策和市场监管中发挥越来越重要的作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号