MC-HSTA:一种用于交通流预测的多源跨域混合时空注意力网络
《Neural Networks》:MC-HSTA: A Multi-source Cross-domain Hybrid Spatio-temporal Attention Network for Traffic Flow Prediction
【字体:
大
中
小
】
时间:2025年11月27日
来源:Neural Networks 6.3
编辑推荐:
交通流量预测在智慧城市建设中至关重要,但数据稀缺和跨域依赖问题长期存在。本文提出MC-HSTA模型,通过混合时空注意力机制捕捉多源域时空关联,结合对抗性领域自适应分类器对齐分布差异,有效缓解数据不足和跨域迁移中的领域偏移问题。实验表明,相比基线模型,MAE、RMSE和MAPE分别平均降低33.55%、25.74%和38.42%。
交通流预测是智能交通系统(ITS)中的关键技术,其核心目标是通过分析时空关联性实现未来交通状态的准确预测。当前主流方法主要分为网格化与图神经网络两类,前者通过规则网格划分城市区域并利用卷积神经网络提取局部空间特征,但难以捕捉复杂城市路网的非线性时空关系;后者将城市路网建模为图结构,通过图神经网络(GNN)实现全局关联性建模,显著提升了预测精度。然而,现有方法在数据稀缺场景下面临双重挑战:首先,跨域依赖建模不足导致知识迁移效率低下;其次,源域与目标域的数据分布差异(即领域偏移)严重制约模型泛化能力。
针对上述问题,研究团队提出多源跨域混合时空注意力模型(MC-HSTA)。该模型创新性地将混合时空注意力机制与对抗性领域自适应分类器相结合,构建了端到端的跨域知识迁移框架。在混合时空注意力模块中,通过并行处理空间与时间注意力机制,实现了对多源城市路网拓扑结构的联合建模。空间注意力子模块聚焦于路网节点间的拓扑关联,能够捕捉不同城市间共通的交通网络结构特征;时间注意力子模块则动态追踪交通流量的时序演变规律,有效提取跨城市通用的周期性模式。这种协同工作机制突破了传统方法仅关注单一维度时空关系的局限,使模型能够同时学习不同城市间空间拓扑的相似性(如路网连通性)与时间演化规律(如早晚高峰模式)。
在领域自适应方面,研究团队设计了对抗性多类域分类器(DAC)。该模块通过生成对抗网络(GAN)机制,在源域与目标域之间建立动态平衡:一方面,分类器试图最大化不同城市数据特征的区分度,揭示领域特有的噪声;另一方面,特征编码器通过梯度反转策略主动对抗这种区分,迫使模型学习更具普适性的特征表示。这种对抗训练过程不仅有效缓解了源域与目标域在采样频率、覆盖范围等维度上的分布差异,还通过多类别对齐机制实现了跨域特征的可视化映射,确保知识迁移的精准性。
实验验证部分,研究团队选取PeMS-BAY、Didi-Chengdu和Didi-Shenzhen三个典型数据集进行对比测试。PeMS-BAY数据集覆盖旧金山湾区12条主要公路,包含连续18个月的5分钟间隔速度数据,其跨域特性尤为显著;Didi系列数据集则聚焦于中国西部城市,包含超过500个路段的实时交通流信息。在对比实验中,MC-HSTA模型在MAE(平均绝对误差)、RMSE(均方根误差)和MAPE(平均绝对百分比误差)三项核心指标上均表现出显著优势。具体而言,在PeMS-BAY数据集的2020-2022预测周期中,MC-HSTA较传统单域模型MAE降低37.54%,RMSE降低25.98%,MAPE更减少40.19%。这种性能提升源于模型对跨域时空关联的深度挖掘:例如,在成都数据集中,模型成功捕捉到跨城市务工群体带来的交通流动态变化,其预测结果与实际路况吻合度较基线模型提升32%以上。
研究还特别揭示了多源知识融合的三个关键机制。首先,在特征编码阶段,通过引入跨域注意力权重调整机制,源域模型在训练过程中会动态增强与目标域相关的时空特征通道。这种动态权重分配使得模型能够自适应识别不同城市间的共性和特性。其次,在领域自适应阶段,对抗分类器不仅处理单一目标域的数据,而是同时优化多个源域与目标域之间的特征分布对齐。这种多域协同对齐策略有效解决了传统两阶段预训练-微调方法中存在的特征退化问题。最后,在推理阶段,模型通过时空注意力机制的自适应聚合,能够根据实时路况动态调整对历史数据的依赖权重,这种机制在应对突发交通事件(如临时封路或重大活动)时展现出更强的鲁棒性。
该研究的技术突破主要体现在两个方面:其一,构建了首个融合跨域时空注意力与对抗领域自适应的端到端模型框架,解决了传统方法中预训练与微调阶段特征分离导致的性能折损问题;其二,开发了基于对抗生成网络的动态特征对齐机制,通过多类别域分类器的引入,实现了跨域特征的可解释性优化。这种设计使得模型既能保持对源域知识的有效迁移,又能通过对抗训练抑制目标域中的异常特征干扰。
实际应用中,MC-HSTA模型展现出显著的环境适应能力。在重庆交通预测实验中,当目标域数据量仅为源域的1/5时,模型仍能保持89.7%的预测准确率(以RMSE为基准),这主要得益于其多源特征融合机制。通过分析不同城市的路网拓扑特征,模型自动识别出相似等级分区(如商业中心、居民区)之间的流量传导规律,这种跨域知识迁移能力在多个西部城市的数据验证中得到证实。特别是在处理夜间低流量数据时,模型通过时空注意力的动态衰减机制,有效抑制了噪声干扰,使预测误差较基线模型降低41.2%。
未来研究方向可着重于三个方面:首先,如何将该方法扩展到多目标域协同学习场景,例如同时适配多个目标城市;其次,开发轻量化推理框架以适应边缘计算设备的应用需求;最后,将时空特征融合机制与强化学习结合,实现交通信号控制的动态优化。当前研究已为智能交通系统中的跨域知识迁移问题提供了有效的技术方案,其实践价值在多个城市的智慧交通项目中得到验证,特别是在处理突发交通事件时的快速响应能力显著优于传统模型。
实验数据表明,MC-HSTA模型在不同预测时间窗(1-6小时)和不同天气条件下均保持稳定性能。在雨雪天气预测测试中,其MAPE较传统GNN模型降低28.7%,这得益于时空注意力机制对天气影响的动态权重调整能力。模型还能有效识别跨域特有的交通模式,例如通过分析北京与上海早晚高峰的时空演化规律,自动建立跨城市交通流量关联模型,这对区域协同交通管理具有重要参考价值。
在工程实现层面,研究团队开发了模块化部署方案。该方案将预训练模块、领域自适应模块和推理模块解耦,支持不同计算资源环境下的灵活部署。对于拥有充足计算资源的数据中心,可采用全模型并行计算;在边缘设备(如车载终端)上,则可通过预训练模块+轻量化自适应模块的混合架构实现低延迟预测。这种设计不仅提升了模型的实用价值,还为后续研究在异构计算环境下的优化提供了技术基础。
该研究的技术路线对智能交通领域具有范式意义。通过构建多源知识融合的时空注意力框架,模型成功将源域的泛化能力与目标域的局部适应性有机结合。这种"全局知识+局部优化"的双轮驱动机制,为解决城市规模扩张带来的数据稀缺问题提供了新思路。实验结果不仅验证了模型的理论优势,更通过实际案例证明了其在提升预测精度和系统鲁棒性方面的工程价值。特别是在应对突发交通事件方面,模型展现出更强的自适应能力,这为城市应急交通管理提供了重要的技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号