《Future Transportation》:Quantitative Methodology for Comparing Microscopic Traffic Simulators
编辑推荐:
本文提出了一种用于比较微观交通仿真器(MTS)的定量方法,重点评估了仿真运行时间、内存使用、运行一致性、行程时间、安全间隙距离和可扩展性。研究开发了一个综合指数,用于评估不同规模和交通密度下的仿真器性能。通过对VISSIM、SUMO和MATSim的测试,结果表明SUMO和MATSim在运行时间和内存使用方面表现出色,在大规模场景中均适用于高需求仿真,其中MATSim展现出更强的可扩展性。VISSIM在行程时间上更贴近现实,并能较好地处理真实的安全间隙距离,使其更适用于密度较低、细节要求高的微观仿真。
研究背景与动机
在交通规划过程中,仿真器被广泛用于模拟现实世界场景,以测试新政策和评估基础设施变更。然而,仿真器的选择往往基于可用性而非技术适用性,特别是在微观尺度应用上。这种选择方式可能导致所选工具无法再现关键行为模式,或在应用于大规模网络时计算不可行。尽管微观仿真器(MTS)被广泛使用,但目前仍缺乏在可比条件下评估其计算效率和行为保真度的定量方法。因此,本研究旨在开发一个统一的定量框架,从计算效率和行为保真度两个方面对微观交通仿真器进行评估和比较。
研究方法论
研究设计了一个包含三个阶段的综合方法:研究设计与评估标准、实验设置以及统计评估。研究首先通过筛选过程选择了三款仿真器:SUMO、PTV VISSIM和MATSim。筛选标准包括与OpenStreetMap(OSM)数据的兼容性、用于交通校准的开放或可定制API(应用程序编程接口)的支持,以及微观或基于智能体(Agent-based)建模的支持。
为了全面评估仿真器性能,研究定义了两种合成网络(小型和大型)和一个真实世界案例(基于纽约Kosciuszko大桥段)。这些网络被用于生成五个具有不同交通密度和时间跟踪特征的场景。评估指标主要分为两大类:计算效率和行为保真度。计算效率包括运行时间、内存使用和可扩展性;行为保真度则包括行程时间准确性、车辆间安全间隙距离以及仿真器的一致性。
为了量化可扩展性,研究定义了三个关键指标:内存可扩展性指数(MSI)、运行时间可扩展性指数(RSI)和综合可扩展性指数(CSI)。这些指标用于评估资源需求如何随模拟智能体数量的增加而增长。统计评估则采用了均值、标准差、Shapiro-Wilk检验、高斯分布、箱线图和蒙特卡洛模拟等方法。
实验结果与分析
运行时间
在运行时间方面,SUMO和MATSim在低密度场景下表现出相对较快的性能。随着网络规模的扩大和交通密度的增加,所有仿真器的性能均有所下降。VISSIM在所有四个场景中始终需要更长的运行时间,特别是在高密度场景下,其处理速度显著降低。MATSim在大规模、高密度网络中表现出色,显示出最小的交通聚集证据,而SUMO在超过100,000个智能体时会出现网络不稳定性,即冻结现象。
内存使用
在内存使用方面,VISSIM和MATSim在所有场景中都表现出渐进且一致的增长,这归因于它们为避免不必要的内存峰值和管理智能体数据及网络复杂性所做的优化。相比之下,SUMO的内存使用量随着交通密度的增加而增加,尤其是在高密度场景下。在第四种场景中,VISSIM的内存需求最高,这与其详细的跟车模型、实时图形渲染以及CPU和内存资源的密集使用有关。
行程时间
在行程时间准确性方面,VISSIM、SUMO和MATSim的平均偏差分别为2.4155、6.8644和21.0424。MATSim的较大偏差归因于其基于队列的仿真动力学(QSim模块)的溢出行为。该模块基于先进先出(FIFO)原则设计,具有高可扩展性,但在低密度场景下处理速度较快,导致仿真性能出现偏差。相比之下,VISSIM和SUMO能够更好地再现现实世界的交通动态。
安全间隙距离
在安全间隙距离方面,VISSIM、SUMO和MATSim的百分比误差分别为0.3181%、0.0081%和2.1727%。MATSim对此测量的响应特别不稳定,因为其跟车模型中智能体不跟随前车,而是独立运行,不受前车约束。VISSIM和SUMO则实现了微观交通模型,其中智能体受到前方空间可用性的约束,需要等待前车通过,从而更准确地再现了安全间隙距离。
一致性分析
一致性分析揭示了仿真器在重复试验中性能的稳定性。MATSim和SUMO在多次试验中表现出更高的计算性能稳定性,其输出围绕均值对称分布。而VISSIM则表现出更大的变异性,这可能是由于其详细的跟车和驾驶员行为建模引入了额外的随机性。
可扩展性
在可扩展性方面,MATSim表现出最高的综合可扩展性指数(CSI)值,为0.741,显示出其在大规模网络仿真中的适用性。SUMO的CSI值为0.530,而VISSIM的CSI值为0,表明其在处理大规模网络时面临挑战。
总结与讨论
研究结果表明,没有一款仿真器在所有情况下都表现最佳,每款仿真器都有其权衡取舍。SUMO和MATSim在运行时间和内存消耗方面表现出色,特别是在大规模场景中,其中MATSim展现出更强的可扩展性。VISSIM在1000至12,000个智能体的仿真阈值内提供了更快的运行时间,并在较低交通量下复制了详细的微观交通行为。
在行程时间准确性方面,VISSIM与现实情况最为接近。在安全间隙距离方面,SUMO提供了最准确的结果。所有仿真器在随机化测试中都表现出了良好的一致性水平。
结论与展望
本研究通过将行为指标纳入评估,确保了比较不仅限于计算性能,还包括了每款仿真器再现现实交通流现象的能力。研究还通过定义内存可扩展性指数(MSI)和运行时间可扩展性指数(RSI),并提出了综合可扩展性指数(CSI)来形式化地解决了可扩展性问题。
基于研究结果,建议VISSIM适用于细粒度、细节要求高的微观交通仿真。未来的工作应着眼于纳入更多仿真器,重点关注提高互操作性和实时性能,并鼓励开放库以支持协作。