综述:交通预测的全面回顾:从传统机器学习到自动机器学习(AutoML)

《Neurocirugía (English Edition)》:A comprehensive review of traffic prediction: From traditional machine learning to AutoML

【字体: 时间:2025年11月22日 来源:Neurocirugía (English Edition) 0.7

编辑推荐:

  本文系统回顾了交通预测模型的演进,分析了传统机器学习与深度学习在时空数据处理中的局限性,提出自动机器学习(AutoML)通过自动化数据预处理、特征工程及模型优化,有效减少人工干预并提升模型泛化能力,同时指出端到端自动化仍面临挑战,为未来研究提供方向。

  随着城市化进程的加快,交通预测成为提升城市交通效率、减少拥堵、优化出行时间以及增强道路安全的重要手段。传统机器学习(ML)模型在交通预测领域已有长期的应用,但它们在处理非结构化数据和捕捉交通网络中复杂的时空关系方面存在局限性。相比之下,深度学习(DL)模型能够有效地处理大规模数据集并学习复杂的模式,然而它们仍然需要大量的人工专业知识来进行模型架构设计、超参数调优以及针对特定数据集的调整。本文对交通预测模型的发展进行了全面回顾,指出了传统ML和DL方法的不足,并引入了自动机器学习(AutoML)作为一种有前景的解决方案。我们讨论了AutoML如何自动化机器学习管道的关键阶段,包括数据预处理、特征工程、模型学习和模型更新,从而降低对人工专业知识的依赖,提高模型的泛化能力,并实现跨数据集的模型适应。尽管已有部分研究将AutoML组件整合到交通预测任务中,但一个完全自动化的端到端流程仍然是一个开放的研究挑战。本文识别了当前存在的研究空白,探讨了AutoML在解决这些挑战方面的潜力,并提出了通过AutoML推进交通预测的未来发展方向。

城市交通系统的复杂性随着人口增长、新建筑的增加和机动车数量的上升而不断加剧。在智能城市建设与城市化进程加速的背景下,城市交通的规划与管理面临着巨大的挑战。有效的交通管理旨在缓解交通拥堵、缩短出行时间并提高道路安全性。在过去三十年中,交通预测一直是许多交通相关领域的重要研究方向,其目标是改善交通网络管理并帮助出行者根据实时交通状况选择最佳路径。交通数据的收集方式多种多样,包括传统的静态方法如人工计数、调查站点、道路传感器、雷达枪和激光枪等,以及新兴的GPS设备、智能手机功能、WiFi信号、无线电信号和蓝牙信号等技术手段。这些方法各自具有独特的优势,它们之间并非相互替代,而是可以互补使用,以支持交通管理和规划工作的开展。收集到的数据通过交通预测模型进行分析,以获取对未来交通状况有价值的洞察。

为了实现交通预测,研究者们已经尝试了多种数据分析模型。首先,统计模型,也被称为模型驱动或参数模型,其运行依赖于特定的参数,例如自回归积分滑动平均(ARIMA)[6]、时空自回归积分滑动平均(STARIMA)[7]以及卡尔曼滤波技术(KFT)[8]、[9]、[10]等。然而,由于交通状况受到天气、事件、节假日以及交通状态动态变化的影响,交通预测应被视为一个非线性问题[11]、[12]、[13]。因此,那些专注于交通预测数学线性性的统计模型无法提供准确的预测结果[14]。相比之下,数据驱动的模型,如传统的机器学习模型,在交通预测中的应用更为广泛。传统的机器学习方法被用于交通预测,包括支持向量回归(SVR)[16]、[17]、K近邻(KNN)[18]、贝叶斯网络[19]以及随机森林[20]等。

然而,传统机器学习模型在处理大规模数据集和非结构化数据方面存在局限性,这促使研究者们更加关注深度学习模型的应用。近年来,深度学习模型在交通预测领域的研究取得了显著进展,这主要得益于其强大的数据处理能力和对复杂模式的学习能力。考虑到时间因素本身并不能提供足够的信息,因此,研究者们开始关注上游和下游检测器之间的关系,以提高预测的准确性[27]、[28]。随后,研究者们采用更复杂的结构来建模交通网络,例如基于网格的结构,该结构结合了卷积神经网络(CNNs)模型,以提取空间关系[30]、[31]、[32]、[33]。然而,基于网格的结构受限于欧几里得框架,无法准确捕捉交通网络的复杂性。因此,研究者们开始探索图结构和图神经网络(GNN)等方法,这些方法能够提取更具意义的关系,从而实现更高效的预测[34]、[35]、[36]、[37]、[38]、[39]。

高质量的机器学习模型设计需要专业知识、大量时间和充足资源[40]。近年来,自动机器学习(AutoML)方法被用于自动化机器学习模型部署的多个阶段,包括数据预处理、特征工程、模型学习和模型更新[41]。通过应用和扩展AutoML方法,可以减少人为错误,降低对专业技能的需求,简化组织层面的机器学习部署流程,并将机器学习技术扩展到各个领域的科学家手中[42]。此外,AutoML已被应用于交通预测领域,以简化各种机器学习任务,包括自动调整模型、设计模型、构建邻接矩阵以及更新模型[43]、[44]、[45]、[46]、[47]、[48]、[49]、[50]、[51]、[52]、[53]、[54]。本文旨在系统地评估和比较传统的机器学习和深度学习方法在交通预测中的应用,突出它们在处理大规模、非结构化和时空数据方面的局限性,并提出AutoML作为一种有前景的解决方案,以实现模型开发的自动化、提高模型的泛化能力,并减少对大量人工专业知识的需求。

本文的其余部分组织如下:在第二部分中,我们将探讨最近在交通预测调查中讨论的进展,并突出本文在该研究领域的贡献。第三部分将介绍传统的机器学习方法,并讨论其局限性。第四部分将描述深度学习方法,并探讨其优势与不足。图1提供了三种传统机器学习模型在交通预测中的组织结构、四种深度学习模型的概述以及它们的局限性。第五部分将介绍AutoML技术,并讨论其在交通预测中的应用。第六部分将介绍关键的回归预测指标,强调与主要领域相关的指标,并随后对深度学习模型和AutoML模型进行比较分析。第七部分将讨论交通预测和AutoML应用中存在的现有挑战和未来发展方向。最后,第八部分将对本文进行总结。

在交通预测领域,已有许多研究对相关方法进行了综述。这些综述研究从不同的角度展示了该领域的发展趋势,例如数据预处理、特征工程、预测模型与分类模型的比较等。然而,当前的综述研究在某些方面仍存在不足。例如,一些综述未能充分涵盖交通预测中所有关键的模型类型,或未能详细讨论模型的适用场景和性能表现。此外,部分综述对AutoML在交通预测中的应用探讨不够深入,未能全面分析其在自动化模型开发、提高模型泛化能力和减少人工干预方面的潜力。本文旨在弥补这些研究空白,通过系统地分析传统机器学习、深度学习和AutoML方法在交通预测中的应用,提供一个更加全面和深入的综述。

传统的机器学习模型在交通预测中主要依赖于结构化的历史数据,以识别模式并进行预测。许多模型关注于捕捉时间方面的特征,其中预测基于当前和过去的时间步数据。此外,一些模型还考虑了空间因素,例如不同地点之间的关系,这对于理解交通在某一地点如何影响或被其他相关地点所影响至关重要。然而,这些模型在处理大规模数据和非结构化数据时往往表现出一定的局限性。例如,基于时间序列的模型可能无法充分捕捉交通数据的复杂性和动态变化,而基于空间关系的模型则可能忽略时间因素的影响。因此,传统的机器学习模型在面对复杂的交通网络时,往往需要人工干预来调整模型参数或设计特征工程,这不仅增加了模型开发的时间成本,也限制了其在实际应用中的可扩展性和适应性。

深度学习模型在交通预测中的应用逐渐增多,主要得益于其强大的数据处理能力和对复杂模式的学习能力。深度学习模型能够自动提取交通数据中的关键特征,并建立非线性的预测关系。例如,卷积神经网络(CNNs)被用于提取交通数据中的空间关系,而循环神经网络(RNNs)和长短期记忆网络(LSTMs)则被用于捕捉时间序列数据中的动态变化。此外,图神经网络(GNNs)等模型能够有效处理交通网络中的复杂关系,例如道路之间的连接性、交通流量的传播路径等。然而,尽管深度学习模型在某些方面表现出色,它们仍然存在一些局限性。例如,深度学习模型通常需要大量的标注数据进行训练,这在实际交通预测中可能难以满足。此外,深度学习模型的训练和调优过程较为复杂,需要大量的人工专业知识和计算资源,这在一定程度上限制了其在实际应用中的普及和推广。

自动机器学习(AutoML)作为一种新兴的技术,旨在减少机器学习模型开发过程中对人工专业知识的依赖。AutoML通过自动化的方式,对数据预处理、特征工程、模型选择和超参数调优等关键步骤进行优化,从而提高模型的性能和效率。在交通预测领域,AutoML的应用具有重要意义。首先,AutoML能够自动化数据预处理过程,例如缺失值填补、数据标准化和数据增强等,这些步骤在传统机器学习中往往需要人工干预。其次,AutoML可以自动进行特征工程,通过搜索最优的特征组合或使用自动化的方法提取关键特征,从而提高模型的预测能力。此外,AutoML能够自动选择适合特定任务的模型架构,并进行超参数调优,以优化模型的性能。最后,AutoML还支持模型的持续更新,使其能够适应不断变化的交通环境。

尽管AutoML在交通预测中的应用前景广阔,但目前仍面临一些挑战。首先,AutoML在处理大规模和高维交通数据时,仍然需要高效的计算资源和算法优化,以确保模型的训练和预测效率。其次,AutoML在特征选择和模型选择方面可能存在一定的不确定性,尤其是在交通数据具有高度非线性和动态变化的特性时。此外,AutoML在处理不同类型的交通数据(如时间序列数据、空间数据和图数据)时,可能需要不同的算法和策略,这增加了模型开发的复杂性。最后,AutoML在实际应用中的可解释性和透明度仍然是一个重要的研究方向,因为交通预测结果需要具备一定的可解释性,以便为交通管理和决策提供可靠的依据。

本文通过系统地分析传统机器学习、深度学习和AutoML方法在交通预测中的应用,提出了一个全面的综述。我们比较了不同模型在处理交通数据方面的优缺点,并探讨了AutoML在交通预测中的潜在优势和挑战。此外,我们还讨论了交通预测中常用的评估指标,例如平均绝对误差(MAE)和平均平方误差(MSE),这些指标对于理解模型的性能和比较不同模型的效果至关重要。通过本文的研究,我们希望为交通预测领域提供有价值的见解,并为未来的研究方向提供参考。

在当前的研究中,交通预测模型的发展呈现出从传统机器学习向深度学习和AutoML演进的趋势。这一趋势反映了研究者们对交通数据复杂性和动态变化的深入理解,以及对提高模型性能和适应性的持续追求。然而,这一演进过程也暴露出了一些关键问题。例如,传统机器学习模型在处理大规模和非结构化数据时的局限性,以及深度学习模型在数据需求和计算资源方面的高成本。这些问题促使研究者们探索更高效的模型开发方法,如AutoML,以降低对人工专业知识的依赖,并提高模型的泛化能力和适应性。

为了进一步推动交通预测的发展,本文提出了几个未来的研究方向。首先,需要开发更加高效的AutoML算法,以适应交通数据的特殊性质,例如高维性、非线性和动态变化。其次,应加强对交通预测模型可解释性的研究,以提高模型的透明度和可信度。此外,还需要探索AutoML在不同交通场景中的应用,例如城市交通、高速公路和智能交通系统等,以验证其在不同环境下的有效性。最后,应加强对交通预测模型的评估和比较,以确保模型的性能能够满足实际应用的需求。

总之,本文对交通预测模型的发展进行了全面回顾,分析了传统机器学习和深度学习方法的局限性,并提出了AutoML作为一种有前景的解决方案。我们讨论了AutoML在交通预测中的应用,包括数据预处理、特征工程、模型选择和超参数调优等关键步骤。此外,我们还探讨了AutoML在处理大规模和非结构化数据方面的潜力,以及其在提高模型泛化能力和适应性方面的优势。尽管AutoML在交通预测中的应用仍面临一些挑战,但其发展趋势表明,它有望成为未来交通预测领域的重要工具。通过本文的研究,我们希望为交通预测领域的研究者和实践者提供有价值的参考,并推动该领域向更加智能化和自动化的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号