基于XAI与元启发式算法优化的机器学习模型在弗吉尼亚州际公路网络旅行时间可靠性预测中的应用研究

【字体: 时间:2025年07月19日 来源:Machine Learning with Applications

编辑推荐:

  为解决交通网络旅行时间可靠性(TTR)预测难题,研究人员采用XGBoost、LightGBM和CatBoost模型结合7种元启发式算法,利用弗吉尼亚州59个州际路段4年数据,发现XGBoost-GWO模型预测精度达92%,显著优于基准模型。该研究为交通规划管理提供了高精度预测工具,其中Link Length和AADT/Lane.mile被识别为关键影响因素。

  

在城市化进程加速的今天,交通拥堵已成为困扰全球大都市的顽疾。旅行时间可靠性(Travel Time Reliability, TTR)作为衡量交通系统性能的关键指标,直接影响着通勤者的出行决策和交通管理部门的规划策略。然而,由于交通流量动态变化、天气条件多变、事故频发等复杂因素,TTR预测一直面临着巨大挑战。传统方法如历史趋势线分析往往无法捕捉这些复杂变量间的非线性关系,导致预测精度有限。

为突破这一技术瓶颈,研究人员开展了一项创新性研究,将可解释人工智能(XAI)与元启发式优化算法相结合,构建了高精度的TTR预测模型。研究团队选取弗吉尼亚州际公路网络作为研究对象,收集了2014-2017年间59个路段的双向交通数据,重点分析了Link Length(路段长度)、AADT/Lane.mile(车道日均交通量)、Total Rate(总事故率)和PRCP/1000(降水量)四个关键特征。

这项发表在《Machine Learning with Applications》的研究采用了三大技术路线:首先运用XGBoost、LightGBM和CatBoost三种梯度提升算法建立基础预测模型;其次采用粒子群优化(PSO)、灰狼优化(GWO)等7种元启发式算法进行超参数调优;最后通过特征重要性分析和统计验证评估模型性能。特别值得注意的是,研究团队构建了包含472个样本的数据集,采用80%-20%的比例划分训练集和测试集,确保了模型的泛化能力。

研究结果部分,模型性能比较显示:

  • XGBoost-GWO模型表现最优,测试集R2达到0.92,训练时间仅需2分44秒,较基准模型提升18%的预测精度。其NRMSE(标准化均方根误差)在训练和测试阶段分别为0.02和0.07,显示出优异的泛化能力。
  • LightGBM-GWO和CatBoost-GWO并列第二,测试集R2均为0.89,但CatBoost-GWO的训练时间长达8分35秒,是LightGBM-GWO的4倍多。
  • 收敛性分析表明,GWO算法在早期迭代就能找到接近最优的解,XGBoost-GWO在第197次迭代达到稳定状态,体现了良好的收敛特性。

特征重要性研究发现:

  • Link Length以0.4986的重要性评分成为最具影响力的预测因子,揭示了路段长度与TTR之间的强相关性。
  • AADT/Lane.mile以0.3470的重要性位居第二,证实交通密度是影响行程时间稳定性的关键因素。
  • 令人意外的是,PRCP/1000的贡献度仅为0.0180,表明降水量在该研究中的预测价值有限。

这项研究通过系统比较21种模型组合,确立了XGBoost-GWO作为TTR预测的最佳解决方案。其重要意义体现在三个方面:首先,92%的预测精度为交通管理部门提供了可靠的决策工具;其次,GWO算法展现出的参数少、收敛快等优势,为类似优化问题提供了参考范式;最后,特征重要性分析结果直接指明了交通规划应重点关注的要素。研究人员在讨论部分也指出了当前局限,如单次运行评估可能影响结果稳定性,以及MFO、WOA等算法表现不佳等问题,为后续研究指明了改进方向,包括尝试多目标优化、引入深度学习模型等进阶方案。这些发现不仅推动了智能交通系统的发展,也为元启发式算法在工程优化中的应用提供了宝贵案例。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号