
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于分层深度强化学习的知识驱动人群疏散仿真方法研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对现有疏散仿真方法难以真实表征和利用应急场景知识的瓶颈问题,研究人员创新性地提出基于分层深度强化学习(Hierarchical DRL)的知识驱动仿真框架。通过构建融合"趋利避害"心理机制的疏散知识图谱(EKG),结合EKG-DRL路径规划与RVO-DRL避碰模型的双层架构,实现了对个体运动机制的高保真模拟。该系统通过三维动画可视化验证,显著提升了仿真的真实性与场景泛化能力,为应急疏散决策提供新范式。
在城市化进程加速的背景下,大型建筑内突发公共安全事件的高效疏散成为重大挑战。传统疏散仿真方法面临两大困境:基于牛顿力学规则(如Social Force模型)或网格离散化(如元胞自动机)的模型驱动方法存在人为规则偏差;而数据驱动方法虽提升真实性,却普遍忽视安全知识(如疏散路线)与危险知识(如灾害扩散)的协同作用。现有研究多孤立考虑单一知识类型,且知识表征常停留于数值抽象层面,难以反映真实应急场景中"趋利避害"的人类决策心理。
为解决这一科学问题,研究人员开发了知识驱动的人群疏散仿真框架。该研究首先通过设备传感器与人类感知构建疏散知识图谱(EKG),整合心理学"趋利避害"理论实现知识结构化表征,并采用TransD模型将图谱转化为可计算数值。核心创新在于分层深度强化学习(Hierarchical DRL)架构:上层EKG-DRL模型负责全局路径规划,下层RVO(Reciprocal Velocity Obstacles)-DRL模型实现局部避碰,通过分阶段训练策略优化个体运动机制。最终开发的三维导航系统在多种场景验证中,较传统方法显著提升仿真真实性与适应性。
关键技术包括:1)融合心理学的EKG知识表征技术;2)TransD图谱嵌入算法;3)分层DRL联合训练框架(含EKG-DRL与RVO-DRL双模块);4)基于Unity的三维可视化系统。实验采用地铁站和建筑火灾等真实场景数据集验证有效性。
【疏散知识表征模型】
通过构建包含安全出口、危险源等节点的EKG,量化"接近收益-规避风险"的边权重,结合TransD模型实现知识向量化。实验显示该模型较传统路径规划算法(如RRT)提升28%的知识覆盖度。
【分层DRL运动模型】
EKG-DRL模块采用DQN算法学习全局路径策略,RVO-DRL模块通过PPO算法优化速度向量。在交叉走廊场景测试中,该模型使平均疏散时间缩短19%,碰撞率降低62%。
【导航系统与实验】
三维系统实现200+智能体的实时渲染。在虚拟地铁站疏散中,本方法较Pang等(2023)的单一知识引导方法提升37%的路径合理性评分,验证了双知识协同优势。
该研究突破性地将心理学机制与分层DRL相结合,首次实现安全/危险知识的协同建模。EKG的动态更新特性支持知识演化模拟,而分层架构为复杂决策提供可解释性。未来可扩展至多灾害耦合场景,并为VR应急训练提供技术支撑。论文发表于《Expert Systems with Applications》,为智慧城市公共安全领域提供重要方法论创新。
生物通微信公众号
知名企业招聘