预测危险化学品道路运输中的初始事故状态:一种因果明确且易于解释的机器学习方法

《Reliability Engineering & System Safety》:Predicting initial accident states in hazardous chemical road transportation: a causal and interpretable machine learning approach

【字体: 时间:2026年02月18日 来源:Reliability Engineering & System Safety 11

编辑推荐:

  危险化学品运输事故的初始状态预测模型研究通过整合因果推断与机器学习,构建了随机森林-逆概率加权(RF-IPW)模型。采用2017-2023年事故文本报告提取因果结构并建立训练集,在有限数据条件下有效降低混杂偏误。SHAP分析显示驾驶员状态和车辆条件是主要影响因素,验证了融合因果分析与可解释性方法在事故预测中的价值,为运输风险管理提供新思路。

  
郭健|任浩轩|马开江
浙江工业大学桥梁工程学院,中国杭州310023

摘要

通过公路运输危险化学品存在较高的事故风险。然而,在事故数据有限的情况下,预测初始事故状态和识别关键影响因素仍然具有挑战性。为了解决这一问题,本研究开发了一个结合因果推断和机器学习的事故状态预测框架。提出了一种采用逆概率加权(RF-IPW)的随机森林模型,以考虑事故相关因素之间的因果效应。利用2017年至2023年间危险化学品公路运输事故的文本案例报告提取因果结构并构建训练数据集。在模型训练过程中应用逆概率加权来减少混淆偏差。随后使用SHapley Additive exPlanations(SHAP)方法对模型进行解释,并评估每个因素的贡献。结果表明,在考虑了因果效应后,所提出的RF-IPW模型在小型数据集上的表现良好。驾驶员状态和车辆状况被确定为影响初始事故状态的最关键因素。这些发现展示了将因果分析和可解释性整合到事故预测模型中的价值,并有助于改进危险化学品公路运输的风险管理。

引言

危险化学品的公路运输是整个化工供应链中的关键环节。它在运输化学品方面发挥着重要作用,类似于毛细血管输送营养物质。从事大宗运输的危险化学品车辆经常在各种道路上行驶。统计数据显示,危险化学品运输环节的受伤和死亡率以及财产损失仅次于生产阶段[1]。因此,鉴于危险化学品的固有风险和运输过程的复杂性,预防危险化学品公路运输事故的策略至关重要[2,3]。
事故报告的文本分析长期以来一直是危险化学品安全研究的基本工具,主要用于深入分析根本原因并制定相应的预防措施[[4], [5], [6]]。目前,流行的数据驱动分析框架侧重于从事故数据中提取和建模因果事故路径,以模拟现实世界运输系统的复杂性[7]。代表性应用采用贝叶斯网络或逻辑回归等统计建模方法来预测危险化学品事故的概率[[8], [9], [10], [11], [12]]。然而,这些方法受到获取可靠先验概率的难度限制,导致预测目标相对单一,限制了进一步推断信息的能力[13]。这些信息不仅需要估计事故的可能性,还需要涵盖更广泛的相关见解。这对于控制事态升级和防止次生灾难至关重要[14]。例如,在2024年中国南绍高速公路上发生了一起危险化学品车辆追尾事故,由于驾驶员跟车过近且超速,导致三辆重型半挂卡车相撞,造成两人死亡,并且运输的危险化学品二乙胺发生爆炸。该事故案例涵盖了事件的初始物理形态(碰撞)、其升级(爆炸)以及后续后果(两人死亡)。对于相关从业者和决策者来说,这些元素是他们积极寻求预测的关键信息。
因此,基于机器学习的特征分析和预测已被应用于危险化学品安全领域[15]。一方面,风险特征的重要性分析本质上是事故原因的诊断。通过直观反映特征与结果之间的相关程度,它可以识别出最关键的风险影响因素[[16], [17], [18], [19], [20]]。另一方面,研究人员利用机器学习方法构建了危险化学品事故的严重性预测模型,或为特定类型的事故开发了精细的预测模型。这些研究为可操作的风险评估任务提供了更关键的信息[21,22]。因此,本研究的重点从挖掘根本原因转向分析和预测危险化学品运输事故的初始物理形态。
尽管之前的研究已经对某些特定的初始物理形态(如碰撞或翻车[23,24])进行了建模,但缺乏一个综合评估框架,能够涵盖运输过程中的所有潜在初始物理形态。事故形态是多维的(例如,翻车、碰撞、追尾等)。单独预测这些形态的模型无法捕捉到它们的共同因果驱动因素,导致见解碎片化。因此,本研究旨在对这些事件进行建模,分析各种风险因素如何导致不同的事故形态。这种方法有助于有效比较不同事故形态之间的差异和共性,从而实现有针对性的干预,防止事态升级。
此外,本研究的另一个贡献在于将危险化学品事故中的因果关系纳入机器学习模型的开发中。在分析危险化学品事故时,将因果关系纳入建模已被证明是加深风险理解的有效方法[25]。如果没有明确构建因果路径,一些间接但关键的影响因素可能会被忽略,导致模型的内部作用机制与现实偏离[26]。为了解决这个问题,本研究构建了一个因果路径图,说明了危险化学品运输事故中风险因素的影响。所有特征变量被分为上游外生变量和下游可干预变量。随后,计算每个外生变量的因果权重并将其纳入模型训练过程[27]。总之,这些局限性突显了建立能够量化因果路径中结构关系的框架的必要性,同时共同建模多个相互关联的事故形态。
为了进一步阐明危险化学品运输中的风险机制并减少事故后果,本文研究了基于因果关系的机器学习算法在分类和预测危险化学品运输过程中事故初始状态中的应用。进一步使用SHapley Additive exPlanations技术分析模型,以检查各种风险因素与初始事故状态之间的耦合关系[28]。这种研究方法为事故风险分析提供了一种新的方法。此外,分析结果可以为相关运营管理部门提供基于风险的决策支持。
本研究的结构如下:第2节提供文献综述,第3节详细介绍了本文的方法论原则,第4节涵盖数据库构建和相关性分析,第5节展示了模型结果的评估以及风险因素与事故状态之间的耦合分析。

部分摘录

文献综述

机器学习已广泛应用于安全生产和运营领域[29,30]。其强大的捕捉非线性关系的能力为传统的风险分析和预测方法提供了新的技术途径。Matías等人[15]的一项早期研究比较了机器学习技术与传统方法在评估危险化学品公路运输风险方面的性能,旨在确定指定路线的适用性

总体方法概述

本研究提出的技术方法如图1所示,包括以下三个步骤:(1)文本处理和特征选择。基于经典因果理论构建线性事故因果模型,然后开发事故文本调查框架。对2017年至2023年间发生的涉及危险化学品的公路运输事故案例进行手动分析。(2)模型训练和性能测试

事故数据库的构建

由于危险化学品公路运输系统的复杂性,清理原始数据以获得准确信息至关重要。分析结果取决于数据集的质量,包括数据的一致性、准确性、完整性以及有价值信息的存在。本研究使用的数据来自2017年至2023年在中国在线发布的事故报告和调查报告

模型性能结果

对原始数据集进行统计分析后,揭示了数据中事故风险特征的初步见解。如图5所示,在初始事故节点的子类别中,设备故障、外部事件、碰撞和翻车的样本分布分别为27.9%、20.8%、25.3%和25.9%。由于数据集规模有限,且存在四个用于预测初始事故状态的子类别

结论

本研究对2017年至2023年的危险化学品事故案例进行了统计分析。所提出的RF-IPW模型通过RF、IPW和危险化学品运输事故状态的因果结构图的三重整合,在小型数据集上提高了预测性能。首先,因果图明确了危险化学品运输事故中风险变量之间的因果关系

CRediT作者贡献声明

郭健:撰写——审阅与编辑、监督、方法论、概念化。任浩轩:撰写——初稿、方法论、调查、形式分析。马开江:撰写——审阅与编辑、方法论、调查、形式分析。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号