深度学习方法在城轨交通车站短期进站客流预测中的应用
《Engineering Applications of Artificial Intelligence》:Deep learning approach for short-term entry passenger flow forecasting in urban rail transit stations
【字体:
大
中
小
】
时间:2025年11月03日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
短时乘客流量预测方法研究:基于CEEMDAN-TCAN的地铁车站聚类优化与时空特征提取模型。
城市轨道交通的短时客流预测对于运营管理至关重要。通过分析历史数据,可以有效预测未来客流趋势,从而帮助优化列车调度、改善车站客流管理并提前预警可能发生的紧急情况。然而,现有的预测方法在解释性方面存在不足,无法提供足够的概率统计信息,这限制了其在实际应用中的效果。本文提出了一种基于两步聚类的CEEMDAN-TCAN方法,以解决这些问题并提升预测精度和可解释性。
### 研究背景与意义
随着城市化进程的加快,地铁作为城市交通的重要组成部分,其客流量呈现出显著的增长趋势。然而,这种增长也带来了诸如车站入口排队时间增加、列车拥挤以及突发事件频率上升等一系列问题。因此,精准的客流预测不仅有助于优化运营效率,还能提升乘客体验,降低运营成本。在这一背景下,利用自动售检票系统(AFC)存储的海量历史客流数据,成为了预测模型的重要数据来源。AFC系统记录了乘客的通行时间、进出站人数以及通行方向,这些数据能够揭示客流的时间模式,为短时预测提供关键支持。
然而,传统方法在处理这种复杂数据时往往存在局限。例如,仅依赖单一车站的历史时间序列数据进行预测,难以捕捉不同车站之间的相似趋势。此外,许多方法未能充分提取时间序列中的多尺度特征,导致预测误差较大。为了全面捕捉不同车站类型的客流特征并提升预测结果的可解释性,本文提出了一种基于两步聚类的CEEMDAN-TCAN模型,该模型能够从多角度分析车站的时空特征,并结合时间卷积注意力机制(TCAN)来提升预测性能。
### 方法概述
本文提出的CEEMDAN-TCAN模型分为三个主要步骤:**数据预处理、两步聚类分析以及基于CEEMDAN和TCAN的预测模型构建**。
#### 1. 数据预处理
数据预处理是模型构建的基础。由于AFC数据可能存在错误,如数据采集、传输、处理和存储过程中出现的异常记录,因此需要对数据进行清洗。本文采用了一种基于局部异常因子(LOF)的异常检测方法,该方法通过计算数据点的局部密度变化来识别异常值。此外,为了提升模型训练效率,本文对数据进行了标准化处理,将客流数据归一化到0-1范围内。
数据预处理的具体步骤包括:
- **识别和消除异常数据**:通过LOF算法检测异常点,并使用平均值进行填补,以确保数据的连续性和完整性。
- **时间粒度处理**:将客流数据划分为15分钟的时间窗口,以捕捉短时变化特征。
- **标准化**:将原始数据转换为0-1范围,以减少数据波动对模型训练的影响。
#### 2. 两步聚类分析
为了提升预测模型的泛化能力,本文采用了一种两步模糊k均值(FkM)聚类方法。该方法首先利用模糊聚类技术对车站进行初步分类,然后通过k均值算法对每个父类进行细分,从而得到具有相似客流特征的子类。
模糊聚类能够提供每个数据点对不同类别的隶属度,有助于后续分析。然而,它在大规模数据集上计算复杂度较高,且可能影响模型的可解释性。相比之下,k均值聚类具有更快的收敛速度和更简单的原理,能够弥补模糊聚类的不足。通过结合模糊聚类和k均值聚类,本文提出了一种两步聚类方法,从而更全面地挖掘车站的时空特征。
#### 3. CEEMDAN-TCAN模型构建
CEEMDAN是一种改进的信号分解方法,能够有效处理非平稳和非线性的时间序列数据。它通过添加自适应噪声,减少模式混叠问题,并提供更准确的分解结果。本文将CEEMDAN用于分解车站客流数据,提取多尺度时间特征,以提升预测的准确性。
TCAN模型则结合了时间卷积网络(TCN)和稀疏注意力机制。TCN通过因果卷积和扩张卷积,能够捕捉时间序列中的长期依赖关系,同时通过残差模块实现信息的跨层传递。然而,TCN的深层结构可能导致计算复杂度上升,影响训练效率。因此,本文引入了稀疏注意力机制,以增强模型对关键历史步骤的关注,同时减少不必要的计算。
TCAN的结构包括:
- **编码器**:将输入的时间序列数据映射为隐藏层的特征表示。
- **解码器**:基于编码器提取的特征,生成预测结果。
- **稀疏注意力机制**:在编码器和解码器之间引入注意力权重,以突出关键时间点对预测的影响。
### 模型优势与创新点
CEEMDAN-TCAN模型相比传统方法具有以下优势:
- **提升预测精度**:通过两步聚类和CEEMDAN的多尺度特征提取,CEEMDAN-TCAN在多个指标上均优于其他经典模型。实验结果表明,该模型的预测误差降低了1.7%至36.9%,显著优于传统方法。
- **提高计算效率**:相比TCN模型,CEEMDAN-TCAN减少了训练时间,平均训练时间缩短了55.8%。这是因为该模型采用了稀疏注意力机制,减少了不必要的历史时间点计算。
- **增强可解释性**:通过注意力权重热图,可以直观地看到哪些历史时间点对预测结果影响较大,从而提升模型的可解释性。
### 实验与结果分析
本文在苏州地铁的169个车站上进行了实验,使用了一周的数据集(2022年8月1日至8月7日)。实验结果显示,CEEMDAN-TCAN模型在多个评价指标上均优于其他模型,包括:
- **均方根误差(RMSE)**:相比其他模型,CEEMDAN-TCAN的RMSE降低了14.56%。
- **平均绝对误差(MAE)**:CEEMDAN-TCAN的MAE降低了13.61%。
- **平均绝对百分比误差(MAPE)**:CEEMDAN-TCAN的MAPE降低了4.1%。
此外,实验还验证了稀疏注意力机制的有效性。通过注意力权重热图,可以发现某些历史时间点对预测结果具有显著影响,而这些时间点的权重较高。同时,通过部分自相关系数分析,可以进一步验证这些时间点在预测中的重要性。
### 模型的适用性与局限性
尽管CEEMDAN-TCAN模型在预测精度和计算效率上表现优异,但其仍然存在一定的局限性:
- **数据范围有限**:本文仅使用了7天的数据,可能无法全面反映不同季节和特殊事件(如节假日)对客流的影响。
- **外部因素未考虑**:实际中,客流还受到天气、节假日等外部因素的影响,而这些因素在AFC数据中可能难以捕捉。
- **时间粒度限制**:本文主要考虑了15分钟的时间粒度,可能无法全面反映客流在不同时间尺度上的变化。
因此,未来的研究可以进一步扩大数据集的时间范围,引入更多外部变量,如天气和节假日信息,以提升模型的适用性和泛化能力。
### 结论
本文提出的CEEMDAN-TCAN模型在城市轨道交通短时客流预测中表现出色。通过两步聚类方法,能够更全面地提取车站的时空特征;通过CEEMDAN,可以有效处理非平稳时间序列数据,提升预测的准确性;通过TCAN,能够捕捉关键的历史时间点,提升模型的可解释性。实验结果表明,该模型在多个指标上均优于其他经典方法,能够有效解决现有模型在预测精度和计算效率上的不足。然而,模型仍需进一步优化,以适应更复杂的时间尺度和外部因素,从而提升其在实际应用中的表现。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号