《Expert Systems with Applications》:Short-term high-speed rail passenger flow forecasting integrated extended empirical mode decomposition with multivariate and bidirectional support vector machine
编辑推荐:
高铁短途乘客流量预测方法创新研究。提出CEEMDAN-MBSVM模型,通过分析多方向OD关联性,分解重构时间序列,结合双向支持向量机预测,实验显示MAPE较基准模型降低11.57%-1.30%,验证了双向OD数据融合的有效性。
关学义|李泽锋|秦进|王成娜
中南大学交通与运输工程学院,中国长沙410075
摘要
高速铁路(HSR)的短期客流预测对于动态调整运营计划和优化运输资源分配具有重要意义。为此,本文提出了一种创新的完整集成经验模态分解与自适应噪声结合多元双向支持向量机(CEEMDAN-MBSVM)方法,该方法包括四个关键步骤。首先,我们分析多个起点-终点(OD)客流之间的相关性,并选择强相关的OD及其对应的反向OD进行联合双向预测。其次,利用CEEMDAN的周期划分技术对原始客流时间序列进行分解,得到多个内在模态函数(IMFs)和一个残差趋势项(RES)。然后应用MBSVM预测每个OD的IMFs,并使用趋势外推法预测RES。最后,重构预测的IMFs和RES以获得最终的双向HSR OD日客流。随后,我们使用京沪高铁的实际数据,对七种预测方法进行了全面的验证和显著性测试。特别是对于五个选定的OD,与现有模型中表现最好的EEMD-MSVM方法相比,我们的模型将最小平均绝对百分比误差(MAPE)降低了1.30%至4.97%;与表现最差的ARIMA模型相比,将MAPE降低了11.57%至22.72%。这项研究清楚地证明了利用双向OD数据改进短期客流预测的价值。
引言
高速铁路(HSR)作为一种高效的中长距离运输方式,在全球范围内得到了迅速发展,中国就是一个典型的例子,中国已经建立了覆盖全国城乡的全面HSR网络,促进了城市化进程。通过将乘客流量从其他交通方式转移过来,HSR有助于缓解公路和航空运输系统的拥堵(B?rjesson, 2014)。然而,鉴于HSR建设成本和运营费用的巨大投入,发展有效的收入管理和运营策略至关重要,而这需要精确的客流预测作为支撑。
因此,为了提高HSR短期客流预测的准确性,已经提出了多种创新的预测模型,包括中长期预测模型(Hao等人,2019;Wei等人,2023)和短期预测模型(Tsai等人,2009;Zhang等人,2020)。然而,由于HSR日客流具有固有的非线性和高波动性,短期预测仍面临诸多挑战。此外,HSR系统的复杂网络结构导致同一路线和方向上不同目的地的客流之间存在相互依赖性。忽视这些空间相关性会显著影响预测准确性。令人惊讶的是,现有文献大多忽略了双向起点-终点(OD)对称性的影响。实证观察发现,在高峰和非高峰时段,双向客流表现出明显的对称性。例如,假期前的出行激增通常会在假期后出现相反方向的返程高峰,如图1所示。这种双向对称性现象值得系统研究,以便通过纳入这些时空模式来优化预测模型。
为了解决上述问题,本研究提出了一种创新的方法,用于短期HSR客流预测,系统地考虑了多个同向OD和双向OD客流之间的相互影响。所提出的方法结合了增强的完整集成经验模态分解与自适应噪声(CEEMDAN)和新型多元双向支持向量机(MBSVM),构建了一个全面的CEEMDAN-MBSVM预测框架。本研究在多个方面为学术界做出了贡献:首先,我们开创了一种考虑多个单向OD和双向OD客流之间相互依赖关系的多双向客流预测方法,这代表了传统单向OD预测方法的重大范式转变;其次,我们通过整合CEEMDAN和MBSVM框架,并采用贝叶斯优化算法进行参数调整,开发了一种创新的CEEMDAN-MBSVM预测模型;最后,我们使用京沪高铁的实际运营数据进行了全面的比较分析和显著性测试,验证了我们的模型优于其他六种现有模型。实证结果表明,我们的CEEMDAN-MBSVM模型具有显著更高的预测准确性。
本文的其余部分安排如下:第2节系统回顾了短期客流预测方法和应用;第3节详细阐述了多元双向OD客流预测的理论方法;第4节展示了数据相关性分析、显著性测试并呈现了实验研究结果;第5节总结了研究结果并指出了进一步研究的方向。
文献综述
文献综述
在技术和人工智能领域,研究人员从历史数据中提取模式以预测未来趋势,这是一种广泛应用于交通系统客流预测的典型方法。根据不同的时间范围,预测方法可以分为三种主要类型:长期、中期和短期预测。由于客流具有固有的非线性特征和显著波动性
框架
铁路运输网络是一个由多个OD组成的复杂系统,客流受到多个OD之间动态座位分配的限制。同一出发站到不同目的地的客流需求之间存在复杂的关系;而现实世界数据显示,双向OD客流(如A→B和B→A)具有显著的时空对称性特征,这些特征共同影响了客流
数据实验和案例研究
作为中国运营规模最大、频率最高的HSR线路,京沪高铁的客流预测研究不仅对该线路的短期运营管理具有重大价值,也为全国HSR网络的运营优化提供了重要参考。本研究选取了2016年8月1日至2017年9月20日的运营数据,重点分析了短期客流特征
结论与讨论
高精度的HSR短期客流预测对运营组织和规划具有重要的指导意义。本研究创新性地利用MDS技术分析了多双向OD之间的复杂时空交互关系,并筛选出了强相关的OD组合。我们提出了一种名为CEEMDAN-MBSVM的结合机器学习模型。首先,我们对多双向OD进行了模态分解
CRediT作者贡献声明
关学义:概念构思、方法论、软件开发、验证、数据可视化、初稿撰写。李泽锋:方法论、软件开发、验证、监督、审稿与编辑。秦进:资金获取、方法论、软件开发、验证、监督、审稿与编辑。王成娜:方法论、软件开发、验证、数据可视化、审稿与编辑。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究工作。
致谢
本研究得到了国家自然科学基金(项目编号:7247011491)、湖南省自然科学基金(项目编号:2022JJ30767)和中国留学基金委(项目编号:202406370132)的支持