DB-DDPG-ET:一种用于地铁站台上下车过程中人群安全风险评估的新框架

《Additive Manufacturing》:DB-DDPG-ET: A Novel Risk Assessment Framework for Crowd Safety during Boarding & Alighting Process at Subway Platforms

【字体: 时间:2026年01月02日 来源:Additive Manufacturing 11.1

编辑推荐:

  动态交互频繁的地铁站台车门区域易因乘客轨迹交织和方向冲突形成非线性拥堵,传统密集度指标难以准确捕捉风险。本文提出DB-DDPG-ET综合评估框架,通过双分支深度确定性策略梯度算法提取乘客位置、速度和角度熵特征,再利用熵权TOPSIS方法融合为集成熵驱动的混乱指数IEDDI,验证其与密集度指标存在显著单调关系(Spearman相关系数0.8986,p=0.0149),有效识别潜在拥堵和异常行为。

  
徐登宇|徐杰|魏冉冉|李博宇|吴静
北京交通大学交通与运输学院,北京,100044,中国

摘要

在地铁站台门口区域,乘客之间不可避免地会发生动态互动,而用于监控拥堵情况的监控视频存在盲区。乘客拥挤程度是最直接的指标,但仅凭这一指标无法准确捕捉到由乘客轨迹交织和方向冲突引起的非线性拥堵现象。为了量化乘客上下车过程中的拥挤风险,本文提出了一种综合风险评估框架(DB-DDPG-ET),该框架将双分支DDPG算法与熵加权TOPSIS方法相结合。首先,开发了一个双分支DDPG模型来提取乘客上下车过程中的运动特征。其次,引入了三个基于熵的指标——位置熵、速度熵和角度熵——来量化拥挤程度。最后,利用熵加权TOPSIS方法将这三个指标综合成一个统一的熵驱动混乱指数(IEDDI),以反映整体乘客运动混乱情况。研究结果表明,IEDDI与传统的密度指标之间的Spearman等级相关系数为0.8986(p=0.0149),这表明两者之间存在显著的单调关系,并且在识别潜在拥堵和异常行为方面具有更高的敏感性和实用性。

引言

在站台-列车接口(PTI)这一有限空间内,大量上下车的乘客相互交织,由于站台几何形状、列车配置、车门宽度以及乘客流动行为等动态因素的随机耦合,这种情况变得非常复杂。乘客的速度和方向高度非平稳且非线性,常常导致他们之间的显著运动冲突[1]、[2]。大多数下车的乘客在出车厢后要么直接行走,要么跟随前面的人,他们的移动受到站台上人群密度的影响[3]。实地调查显示,在高流量车站,上车乘客往往会忽略地面引导标志[4],而下车通道的容量和布局取决于站台的可用空间以及乘客之间的互动情况。当PTI区域的拥挤程度增加时,等待的乘客会试图在下车乘客之间寻找空隙以绕行上车,从而导致通道进一步变窄,进一步降低通行能力[5]、[6]。随后跟随的乘客被迫采取斜向并行的行为,这会降低移动速度并加剧拥堵,直接导致上下车过程陷入僵局[7]、[8]。此时整体运营效率下降,PTI区域发生踩踏事件的风险也会增加[7]、[8]。在上下车过程中,乘客之间的拥挤和冲突容易导致踩踏或跌落轨道的情况,中国地铁系统中就发生了许多此类事件。例如,在上海地铁1号线人民广场站和曹杨路站,一名女性乘客因拥挤而在列车进站时意外跌落轨道身亡[9]、[10]。北京地铁第一运营公司运营的四条线路上还发生了40多起乘客或携带行李被困的事件[11]。
随着无人值守列车运行(UTO)的出现和增加,PTI区域下车和上车乘客之间的冲突和踩踏风险变得更加令人担忧,因为在UTO模式下,车门控制方式、停车精度和应急响应都有所不同[12],这增加了致命事故的发生几率。因此,研究乘客之间的互动机制并分析他们双向运动的动态演变对于准确把握乘客流动风险的变化以及促进更安全、更有组织的上下车过程至关重要。
总之,本文提出了一种上下车行为优化框架——双分支DDPG(DB-DDPG)模型,该模型结合了改进的社会力模型(ISFM),能够精细模拟相邻区域乘客拥堵的动态演变。在此基础上,提取了乘客位置、速度和角度等关键行为特征,并计算了相应的熵指标。此外,还开发了一个综合的拥挤风险评估框架——双分支DDPG和熵加权TOPSIS(DB-DDPG-ET),该框架整合了DB-DDPG模型和熵加权TOPSIS方法来评估乘客流动的拥堵特征,其结构如图1所示。本文的主要贡献如下:
  • 1.
    开发了DB-DDPG这一通用的上下车行为再现框架,用于优化高峰时段的上下车过程,这些过程受到现场数据稀少和受控实验数据的限制。
  • 2.
    通过将社会力模型的物理建模机制与DB-DDPG中的策略优化相结合,定义为代理的上下车乘客能够自主学习并优化他们的行走行为,而无需任何预定义的规则和策略。
  • 3.
    采用组合共享策略,通过训练单个代理来简化训练复杂性,从而减轻多代理系统中由于环境非平稳性导致的收敛问题。
  • 4.
    结合位置熵、速度熵和角度熵,基于TOPSIS提出了一个统一的IEDDI指数。
本文共分为六个部分。引言之后,第2节回顾了相关文献。第3节详细描述了问题背景。第4节介绍了方法论框架,重点介绍了DB-DDPG算法和基于乘客位置、速度和角度的风险评估模型。第5节展示了实验结果并评估了所提出方法的性能。第6节总结了本文的主要发现。

文献综述

文献综述

上下车风险指的是行人系统在复杂互动和动态干扰下保持运行安全和稳定的能力。实施一种稳健、全面的基于评估的风险管理策略将大幅降低踩踏事件和意外伤亡的可能性。因此,评估上下车风险是行人安全和人群动态研究领域的一个关键方向。

乘客上下车场景

根据[48]的研究,大多数上车乘客倾向于在站台入口附近等待上车,该区域人满为患且最为繁忙,因此被选为模拟场景,如图2所示。根据实地研究和相关参考文献[3]、[49],列车为B型,尺寸为5 × 2.8平方米,车门宽度为1.4米,座位分布在四个角落。
总行驶时间和僵局概率直接受到

双分支DDPG算法

高维且复杂的乘客上下车过程被建模为一个马尔可夫决策过程(MDP),其中上下车乘客被视为代理。代理的行为由策略π定义,即状态到动作的映射π:SP(A)。系统在任何给定时刻的环境信息由状态s∈S表示。动作空间A=RN,表示代理在环境中可能执行的所有动作集合,其中N表示动作维度。

模型验证

在本研究中,强化学习被嵌入到粒子动力学模拟环境中,以再现乘客与环境之间的连续机械互动。个体的位置和速度会相应更新。该算法使用Python 3.8和PyTorch框架实现。模型采用了多种常见的稳定技术,包括经验回放、目标网络、探索噪声和软参数更新,以防止

结论

地铁站乘客的上下车行为表现出显著的复杂性和个体差异性。本文采用双分支DDPG算法(DRL方法)在动态环境中提取乘客上下车过程中的微观行为特征。基于位置熵、速度熵和角度熵构建了一个多维评估指数系统。此外,还使用了熵加权TOPSIS

CRediT作者贡献声明

徐登宇:撰写——审稿与编辑,撰写——初稿,方法论,形式分析。徐杰:撰写——审稿与编辑,撰写——初稿,验证,监督,软件,方法论,调查,数据整理,概念化。魏冉冉:形式分析。李博宇:形式分析。吴静:软件,形式分析。

利益冲突声明

作者声明他们没有已知的财务利益冲突或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号