《Nature Communications》:Active inference as a model of collision avoidance behavior in human drivers
编辑推荐:
避撞——涉及快速威胁探测与迅速执行恰当的规避机动——是驾驶的一项关键方面。然而,现有的人类避撞行为模型较为零散,聚焦于特定场景或仅描述避撞行为的某些方面,如反应时间。本文通过提出一种基于主动推理(Active Inference)的人类避撞行为计算认知模型来解
避撞——涉及快速威胁探测与迅速执行恰当的规避机动——是驾驶的一项关键方面。然而,现有的人类避撞行为模型较为零散,聚焦于特定场景或仅描述避撞行为的某些方面,如反应时间。本文通过提出一种基于主动推理(Active Inference)的人类避撞行为计算认知模型来解决这些空白。主动推理(Active Inference)为建模人类行为提供了一种统一途径:自由能(Free Energy)的最小化。在先前主动推理(Active Inference)工作基础上,研究人员模型结合了既定的认知机制(如证据累积(Evidence Accumulation)),以模拟人类在三种不同避撞场景中的反应:前车制动引起的追尾场景、对向车辆横向侵入场景,以及另一车辆在交叉路口不让行场景。研究人员证明该模型解释了范围广泛的人类避撞行为既有实证发现。具体而言,该模型紧密重现了文献中先前报告的荟萃(Meta)分析汇总结果以及两项近期驾驶模拟器研究中观察到的详细场景特异性效应,包括反应时机、机动选择和执行。研究人员的结果凸显了主动推理(Active Inference)作为通用框架在理解和建模复杂真实驾驶任务中人类行为的潜力。
本研究发表于《Nature Communications》。当前人类避撞行为建模存在明显局限:现有计算认知模型多为碎片化,往往只针对特定场景(如追尾冲突、合流冲突)或仅刻画行为的某一方面(如反应时间、偏离程度),无法同时涵盖反应选择、时机与执行并跨场景泛化;基于大规模驾驶数据的机器学习模型虽具跨场景生成轨迹的能力,但因安全关键行为在数据中代表性不足,难以产生具代表性的类人避撞行为。为此,研究人员开展了一项基于主动推理(Active Inference)统一框架的人类避撞计算认知模型研究,该框架核心原则是智能体通过感知与行动最小化自由能(Free Energy),能够进行未来规划的智能体选择使预期自由能(Expected Free Energy, EFE)最小化的策略,其中EFE包含务实值(pragmatic value,对应偏好观察的实现,如避免碰撞、保持车道、控制平顺等)与认知值(epistemic value,对应信息增益以降低不确定性)。研究人员在离散时间序贯过程中构建模型,结合若干关键感知、认知与运动机制:基于光流扩张(looming)的感知(观察者不能直接获运动学状态,而是通过视网膜视角φ及其导数角速率φ?即looming来推断,并设最低可检测φ?0阈值以反映感知局限);规范条件粒子滤波(norm-conditioned particle filter)用于他车行为预测,在运动学似然基础上引入规范概率偏置(如车辆通常保持车道、让行右行等),当观测到规范违反时逐步放松偏置以覆盖运动学可行但低概率的长尾行为;基于惊喜(surprise,即务实值残差信息)的累积证据触发全策略重规划机制(累积率λ,阈值1),平时仅扩展当前策略一时步,累积证据超阈值才用交叉熵方法(Cross-Entropy Method, CEM)重新采样评估候选策略;策略采样受有界规划容量约束(限制评估策略数,加速度受踏板切换延时约束:along?0 ms?2时需保持0.2 s再变向,加加速度/jerk有限);策略选择依据最小化EFE;模型参数部分引自文献、部分手动调节以匹配前两场景人类数据,同一套参数直接用于第三未见场景。研究人员在三个场景评估模型:①追尾(front-to-rear)场景:前车突然制动,系统变动初始速度v0(10~25 ms?1)与时间隙(time gap, 0.5~3 s),比对既有文献中刹车反应时间荟萃回归、减速度—inverse TTC关系、SHRP2与ANNEXT实车数据趋势,模型运行各条件32次;②对向横向侵入(opposite-direction lateral incursion)场景:复现英国利兹大学驾驶模拟器研究(Johnson等)三类侵入陡度(steep/medium/shallow),各运行64次,比对人类规避方向(左向对向车道/右向路肩)、碰撞率、刹车与转向反应时间(以纵向加速度≤?1 ms?2、方向盘转角≥0.0077 rad为起判);③交叉路口右转侵入(intersection right-turn-into-path)场景:复现加拿大圭尔夫研究(Ziraldo等)两种变式:右转停车后起步侵入(RS)、非停车匀速右转侵入(RNS),各运行96次,比对首轮人类碰撞率与反应时间。结果如下:追尾场景,模型在低中速、较大时间隙时仅刹车避撞,高速或短时间隙时倾向刹车+转向甚至仅转向,刹车反应时间与时间隙呈近似线性正相关、与速度无关,减速度幅值随刹车起始inverse TTC增大而增加,符合人类meta分析结果;横向侵入场景,模型在复现人类对不同陡度的规避模式(steep→左转向避入对向车道,shallow→右转向路肩,medium因不确定性高、规范偏置致多数碰撞)同时复现了人类总体碰撞率与各场景刹车/转向反应时间中位数范围(刹车时滞无系统差异、转向在shallow略迟于人类);交叉路口场景(未见、无重调参)同样复现了RS高避让率、RNS较高碰撞率及RS反应慢于RNS的人类差异,中位反应时差≤0.2 s。消融实验表明:去掉证据累积→反应过快、浅侵入全早刹停车致不必要碰撞、路口RNS全避让(不类人);去掉行为预测噪声→横向/路口场景反应过早、规避方向单一(均左)、碰撞率为0(过于确信不类人);去掉踏板约束→刹车反应提前~0.2 s(对应脚移时);去掉looming或looming阈值→追尾长间隙反应偏快(尤其无阈值时),纵向场景需looming阈值模拟远距相对速度不可见;去掉规范条件粒子滤波→横向medium碰撞略降但shallow碰撞增、反应偏慢(因无规范偏置时期望他车回己车道致惊喜累积慢),路口反应偏快、全避让(无让行期望则过早反应),且在常规非冲突场景会产生过度保守行为;去掉EFE认知值分量在本题场景无显著影响(因无 epistemic affordance),但在有观测受限场景会影响(补充验证)。参数敏感性分析显示证据累积率λ与碰撞成本gC影响最大,多数参数小幅扰动鲁棒,最终参数在未见路口场景也泛化良好。研究表明该主动推理(Active Inference)框架可统一解释人类避撞的反应选择、时机与执行,跨三种异质场景泛化良好,各认知机制(looming感知、规范偏置预测、证据累积触发重规划、有界CEM策略搜索、踏板约束)均对类人行为不可或缺。讨论部分指出,相比已有开环/仅纵向闭环模型,该模型通过EFE驱动的动态重规划实现闭环多机动协同;规范条件粒子滤波解决了纯运动学预测过悲观与非规范场景需松绑的矛盾;证据累积以务实值残差(惊喜)为累积量,触发EFE重规划而非直接定动作,统一了时机触发与决策;主动推理(Active Inference)与具身认知(enactive cognitive science)共享自我维持偏好状态集的存在论基础,模型中偏好观察(维持速度、车道、低控制、无碰撞、安全裕度)对应驾驶员“有意义的状态”,EFE最小化对应寻求务实与认知价值(affordance:pragmatic/epistemic affordance)。该模型局限包括参数手动调节、他车非反应式、感知仅looming未全覆盖垂直运动与视野因子、文化相关规范与偏好未显式情境化、策略搜索用运动学粒子+ CEM难扩至复杂多智能体拥挤场景;未来可引入数据驱动轨迹预测混合、交互规范与沟通行动、精细化感知变量(τ、bearing angle、光流率等)、 sophisticated inference递归心智建模、系统参数优化学习。总之,研究证明主动推理(Active Inference)可作为人类道路使用者建模的通用框架,可用于仿真基准中人因代理(human agent)、自动驾驶系统安全评估的虚拟人基准。