编辑推荐:
为解决比特币价格预测缺乏综合视角的问题,研究人员开展了利用多种输入数据、特征选择及多种模型(ML、DL)预测比特币价格的研究。结果显示 SVM 在预测价格走势时表现最佳,Boruta - SVM 最具盈利能力。该研究助力投资者决策。
在数字金融的浪潮中,比特币自诞生以来便备受瞩目。2008 年中本聪推出比特币白皮书后,加密货币市场迎来了爆发式增长,到 2021 年 11 月,其市值飙升至超 2.9 万亿美元。在萨尔瓦多和中非共和国等国家,比特币甚至被赋予了法定货币的地位。然而,这个市场的波动性如同坐过山车一般。比特币价格的起伏受到供求关系、市场成熟度、监管政策、媒体舆论等多种因素影响。一方面,这种波动让它成为了投机者眼中的香饽饽,也被部分人视作资产多元化配置的选择;但另一方面,也有人质疑它作为 “避风港” 资产的可靠性。这使得准确预测比特币价格变得极为关键,却又困难重重。
传统的金融市场预测本就充满挑战,比特币市场更是如此。数据中的噪音干扰了规律的探寻,市场因素间复杂的相互作用让预测难度倍增,例如媒体报道引发的投资者情绪波动,会直接影响比特币价格走向。而且,比特币发展历程较短,可用于训练预测模型的历史数据有限。此外,有效市场假说(EMH)也给比特币价格预测带来了理论上的困境,虽然有研究表明比特币市场在某些阶段符合该假说,但也有研究指出加密货币市场整体效率并不高。尽管不少研究在比特币价格预测上取得了一定成果,但现有研究仍缺乏全面性,没有综合考量输入数据类型、特征选择和模型类型等因素,对于机器学习(ML)和深度学习(DL)模型谁更适合预测比特币价格也尚无定论。
在这样的背景下,密苏里科技大学(Missouri University of Science and Technology)的研究人员 Oluwadamilare Omole 和 David Enke 开展了一项深入研究。他们的研究成果发表在《Engineering Applications of Artificial Intelligence》上,为理解比特币价格波动和指导投资决策提供了重要参考。
研究人员采用了一套复杂而严谨的技术方法。首先是数据准备,他们收集了比特币价格、链上指标(on - chain metrics)和技术分析指标(TA),涵盖了 3758 天的数据,从 2013 年 3 月 11 日至 2023 年 6 月 24 日。之后利用 Boruta 算法进行特征选择,筛选出最相关的特征,以降低数据维度,避免 “维度诅咒” 问题。接着,他们训练了多种 ML 和 DL 模型,包括支持向量机(SVM)、随机森林(RF)、梯度提升机(GBM)、长短期记忆网络(LSTM)、卷积神经网络 - 长短期记忆网络(CNN - LSTM)等,用于分类和回归任务。最后通过交易模拟来评估模型的盈利能力。
研究结果
- 模型预测性能对比:在预测比特币价格走势(价格方向)时,SVM 模型表现最为出色,准确率达到 83%,F1 分数为 82%。在预测价格幅度方面,该模型的均方根误差(RMSE)最低,为 1531.3,同时 R2达到 0.9856 ,显示出良好的拟合优度。DL 模型在分类任务上表现出一定竞争力,但在回归任务中大多表现不佳。
- 特征选择和数据类型的影响:研究发现,Boruta 特征选择方法显著提升了模型性能。链上数据的加入也对模型性能有明显改善,尤其在分类任务中效果突出。
- 模型盈利能力评估:通过回测评估模型的盈利能力,Boruta - SVM 成为最具盈利能力的模型。分类模型大多能获得正收益,而回归模型则多产生亏损或仅有微薄收益。
研究结论与讨论
综合来看,这项研究强调了特征选择、模型选择和目标类型在比特币价格预测中的重要性。研究结果表明,不同模型在比特币价格预测的不同方面各有优劣,SVM 在预测价格方向和幅度上展现出优势,而 DL 模型虽然在分类任务有潜力,但在回归任务中还需改进。Boruta 特征选择方法和链上数据对提升模型性能的积极作用,为后续研究和实际应用提供了新的思路。
从投资角度而言,该研究成果为投资者提供了有价值的参考。投资者可以依据这些结论,更明智地选择预测模型和输入数据,优化投资策略,从而在波动的比特币市场中做出更合理的决策,有望实现收益最大化。这一研究也为加密货币市场的研究开辟了新方向,未来研究可以在此基础上进一步探索其他影响比特币价格的因素,改进模型结构,提升预测的准确性和可靠性。