基于可解释AI的音乐与导航分心对驾驶员工作负荷的量化研究:和谐还是隐患?

《Safety Science》:Harmony or hazard? Quantifying driver workload under music and navigation distractions using interpretable AI

【字体: 时间:2025年10月16日 来源:Safety Science 5.4

编辑推荐:

  本研究针对音乐与导航提示双重听觉分心对驾驶员工作负荷的交互影响这一研究空白,通过驾驶模拟器实验,结合多模态生理(EDA、ECG、EEG)与行为数据,构建了 stacking 集成学习模型,准确率超91%。利用SHAP可解释AI框架揭示了关键预测因子(如顶叶Gamma波、车辆位置)的非线性效应与阈值规律,为实时驾驶员辅助系统的自适应听觉交互设计提供了理论依据与重要启示。

  
在当今汽车社会,驾驶员分心是导致交通事故的关键因素之一,其中工作负荷升高是损害驾驶表现的重要中介变量。随着车载信息娱乐系统的普及,车内听觉环境变得日益复杂。音乐和导航语音提示作为两种最常见的听觉刺激,都可能占用认知资源,干扰注意力分配,从而影响驾驶员的工作负荷。然而,以往的研究大多孤立地考察音乐或导航的单一影响,对于它们在不同道路环境下如何共同作用于驾驶员工作负荷,我们知之甚少。这种认知空白限制了车载听觉系统的优化设计,也阻碍了针对复杂驾驶场景的有效安全干预措施的开发。为了填补这一空白,一项发表在《Safety Science》上的研究应运而生,旨在系统量化音乐与导航分心对驾驶员工作负荷的复合影响。
为了回答上述问题,研究人员设计并实施了一项基于驾驶模拟器的实验。该研究招募了63名参与者,在18种不同场景下进行驾驶。实验设计巧妙地融合了三个音乐节奏条件(无音乐、慢节奏、快节奏)、两种导航提示频率(高、低)以及三种道路环境(常规道路、学校区域、工作区)。研究团队采集了包括皮肤电活动(EDA)、心电图(ECG)、脑电图(EEG)、驾驶行为数据和主观工作负荷评估(采用简化版NASA-TLX量表)在内的多模态数据。在数据处理阶段,对生理信号进行了基线校正、滤波去噪和平滑处理,并将所有数据重采样至1 Hz以保持同步。在方法论上,研究采用了 stacking 集成学习框架,融合了随机森林(RF)、XGBoost、LightGBM和CatBoost四种基学习器的优势,构建工作负荷预测模型。模型性能通过准确率、精确率、召回率和F1分数等指标进行评估。更重要的是,研究引入了基于SHapley Additive exPlanations (SHAP)的可解释人工智能框架,以揭示各特征变量对工作负荷预测的贡献度及其非线性影响模式。
5.1. 描述性统计
对收集到的多模态数据进行描述性分析,结果显示驾驶行为指标(如速度、加速度)和生理指标(如EDA的SCL、ECG的RR间期、各脑区EEG频段功率)在不同实验场景下存在显著变异,为后续建模提供了丰富的信息基础。通过方差膨胀因子(VIF)检验排除了多重共线性较高的变量,最终保留30个变量用于模型训练。
5.2. 模型性能
模型比较结果表明,stacking 集成模型在低、中、高工作负荷水平的分类任务上均表现最佳,准确率均超过91%,优于任何单一模型(如RF、XGBoost等),体现了集成学习在提升预测精度和鲁棒性方面的优势。
5.3. 不同变量对工作负荷的影响
5.3.1. 特征重要性
SHAP分析结果显示,皮肤电活动水平(SG_Scl)、车辆相对于道路中心的平均偏移(ofstRoad_mean)、心率变异性(SG_RR)、顶叶Gamma波功率(P_Gamma)和颞叶Gamma波功率(T_Gamma)等变量在不同工作负荷水平下均具有较高的预测重要性。这表明生理和行为指标的整合对于准确预测工作负荷至关重要。
5.3.2. 变量对不同工作负荷水平的影响效应
进一步分析揭示了关键变量的非线性效应及其阈值规律。例如,车速(spdKPH_mean)与工作负荷呈非单调关系,过高或过低的速度均与高工作负荷相关。车道位置(ofstRoad_mean)的影响也呈现非线性,不同车道对应的工作负荷水平存在差异,特别是第二车道表现出工作负荷状态的过渡特性。生理指标方面,SG_Scl在不同工作负荷水平下存在重叠但可区间的阈值范围;SG_RR在低、中负荷下影响平缓,但在高负荷下其值的增大会显著提高高负荷的预测概率。EEG指标中,顶叶和颞叶的Gamma波功率以及顶叶Theta波功率在不同负荷水平下表现出不同的贡献模式和阈值。
该研究通过系统性的实验设计和先进的数据分析方法,得出了一系列重要结论。首先,在听觉刺激的交互影响方面,研究发现高频率导航提示搭配慢节奏音乐通常与较低的工作负荷相关,而低频率导航提示搭配快节奏音乐则会增加工作负荷,尤其在复杂道路环境中更为明显。这揭示了听觉刺激组合与任务需求匹配的重要性。其次,在方法论上,研究成功构建了高精度的 stacking 集成学习模型,证实了多模型融合在复杂驾驶场景工作负荷预测中的优越性。最后,也是最具创新性的发现在于,通过SHAP可解释AI框架,研究不仅识别出EDA、ECG、顶叶和颞叶Gamma波活动以及车辆位置等关键预测因子,还深入揭示了这些变量存在的非线性效应和跨越不同工作负荷水平的 distinct 阈值模式。
这项研究的发现具有重要的理论意义和实践价值。在理论层面,它通过系统整合听觉和情境因素,深化了对驾驶员工作负荷形成机制的理解,特别是揭示了多源听觉分心的交互作用及其神经生理基础。在实践层面,研究所确定的关键预测指标和阈值可为开发实时驾驶员状态监控系统提供直接依据。例如,智能汽车可以根据实时监测的生理和行为信号,动态调整导航提示的频率或音乐播放的节奏,以帮助驾驶员将工作负荷维持在适宜水平,从而提升驾驶安全性。此外,研究展示的可解释AI框架也为在其他复杂人机交互场景中构建透明、可信的智能系统提供了方法论借鉴。尽管存在样本来源、模拟器生态效度等方面的局限,但这项研究无疑为理解和优化驾驶环境中的听觉交互设计迈出了关键一步,为未来更安全、更智能的驾驶辅助系统奠定了坚实的基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号