Tab-Text:融合表格数据与自然语言增强的交通事故安全建模新范式

【字体: 时间:2025年06月06日 来源:Expert Systems with Applications 7.5

编辑推荐:

  【编辑推荐】针对传统交通事故分析中表格数据信息丢失严重、难以捕捉非线性特征的局限,研究人员创新性提出多模态框架Tab-Text,通过模板构建文本叙事(LLMs处理)与表格数据协同建模。实验证明该方法在事故严重程度预测中显著优于CatBoost等基线模型,尤其提升致命/重伤事故识别准确率,为交通安全领域提供首个LLMs融合应用范例。

  

交通事故每年在全球造成巨大生命损失,仅美国就有约4.2万人因此丧生。尽管车辆安全技术和道路设计不断进步,但事故频发和严重程度控制仍是棘手难题。传统研究依赖结构化表格数据(如碰撞类型、天气等分类变量),采用统计模型或机器学习(如随机参数多项式Logit模型、CatBoost树模型)进行分析,但存在两大痛点:一是人工编码的表格数据丢失事故叙事细节,二是传统方法难以捕捉人-车-路-环境复杂交互的非线性特征。

为突破这些限制,研究人员开展了一项开创性研究,提出Tab-Text多模态框架。该研究首次将大语言模型(LLMs)引入交通安防领域,通过模板将表格数据转化为自然语言描述(如"夜间雨天,卡车与轿车在交叉路口侧面碰撞"),再结合ELECTRA Transformer模型进行双模态特征融合。实验采用澳大利亚维多利亚州事故数据集,结果显示:在预测致命/重伤事故时,Tab-Text的F1
分数比最佳基线模型提升12.3%,关键影响因素排序与传统计量模型一致但解释性更强。这项发表于《Expert Systems with Applications》的工作,标志着交通安防研究从纯表格分析向"数据+语义"协同建模的范式转变。

关键技术方法包括:1)基于预定义模板的表格-文本转换技术;2)ELECTRA模型的双模态特征提取;3)CatBoost、T2T-Transformer等5种基线模型对比;4)SHAP和注意力热图(attention heatmap)可解释性分析。

【文献综述】
梳理了交通建模的两大技术路线:传统统计方法(如随机参数多项式Logit)的局限性,以及机器学习(如XGBoost、TabTransformer)在特征交互捕捉上的优势,指出LLMs在语义理解方面的潜力尚未开发。

【方法】
创新性提出"表格-文本"转换模板,保留原始变量同时生成自然语言描述。采用ELECTRA而非BERT,因其更高效的替换标记检测预训练机制。多模态融合层采用注意力机制协调表格特征和文本嵌入。

【实验结果】
在5类事故严重程度预测任务中,Tab-Text的加权准确率达87.6%,较CatBoost提升4.2%。特别对罕见但高风险的致命事故,召回率提高19.8%。SHAP分析显示"酒驾""高速碰撞"等关键因子与临床研究结论高度吻合。

【结论】
该研究证实:1)LLMs能有效解码表格数据隐含的语义信息;2)多模态融合提升模型对极端事件的敏感性;3)保持与传统方法一致的可解释性。这项工作为智能交通系统提供了新方法论,未来可扩展至实时风险评估和自动驾驶安全策略优化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号