一种基于立方卡尔曼滤波器(Cubature Kalman Filter)与长短期记忆网络(Long Short-Term Memory Network)相结合的时变车辆状态同步估计方法

《Mechanical Systems and Signal Processing》:A synchronized estimation method for time-varying vehicle states via hybrid of cubature Kalman filter and long short-term memory network

【字体: 时间:2026年02月15日 来源:Mechanical Systems and Signal Processing 8.9

编辑推荐:

  自动驾驶系统需依赖时变状态(纵向/横向速度、横滚角、质心侧滑角)实现安全控制,但高精度传感器成本高昂。本文提出混合LSTM卡尔曼滤波器(HLCKF),通过多输出头耦合LSTM(MHPC-LSTM)嵌入CKF框架,解决模型不确定性和传感器噪声问题。实验表明,HLCKF在仿真平台中优于传统滤波方法及标准LSTM网络,兼具高精度、强鲁棒性与实时性。

  
陈家吉|胡杰|张佩|徐文才|唐玉轩|杨东浩
湖北汽车零部件先进技术重点实验室,武汉理工大学,中国武汉470030

摘要

自动驾驶系统依赖于诸如纵向速度、横向速度、偏航率和质心侧滑角等时变状态,以实现安全稳定的控制。然而,高精度传感器的高成本阻碍了它们在大规模生产车辆中的广泛应用,这使得状态估计技术变得至关重要。为了提高估计的准确性和鲁棒性,本文提出了一种基于LSTM的混合立方卡尔曼滤波器(HLCKF),该滤波器将长短期记忆(LSTM)网络集成到立方卡尔曼滤波器(CKF)框架中。首先,构建了一个非线性系统模型以提供估计的物理支持。然后,设计了一个多输出头部和窥视耦合LSTM(MHPC-LSTM)并将其嵌入到CKF中,以减少模型不确定性和传感器噪声对CKF预测的影响。最后,通过构建仿真平台验证了MHPC-LSTM的预测性能和HLCKF的状态估计能力。实验结果表明,所提出的MHPC-LSTM在预测准确性和鲁棒性方面均优于传统的基于模型的方法和标准LSTM网络,使其适用于CKF预测阶段。进一步分析表明,HLCKF在估计准确性和输出稳定性方面均超过了单独的CKF和LSTM方法,同时保持了满足自动驾驶系统实时要求的推理时间。

引言

时变车辆状态估计是指推断和预测动态变化的车辆状态的过程,这一过程广泛应用于自动驾驶、智能交通系统和车辆控制等领域[1]、[2]。在自动驾驶系统中,纵向速度、横向速度、偏航率和车辆质心侧滑角共同描述了车辆的平面运动,并且能够表征大多数动态驾驶场景。具体来说,纵向速度直接影响加速、制动和纵向动力学,而横向速度控制横向运动行为和转向响应。偏航率描述了车辆绕垂直轴的旋转运动,与偏航稳定性密切相关。质心侧滑角量化了车辆行驶方向与实际速度方向之间的偏差,是车辆稳定性和轮胎-路面抓地力限制的关键指标。作为纵向和横向控制的关键参数,这些状态直接决定了自动驾驶系统是否能够实现安全高效的驾驶。
通过将传感器测量数据与车辆动态模型相结合,估计算法能够在复杂的动态条件下精确且鲁棒地实时推断出关键车辆状态,为车辆控制提供可靠的基础[3]。现有方法主要分为基于模型的滤波方法和数据驱动的学习方法。其中,卡尔曼滤波在零均值高斯噪声下提供了最优估计,计算成本较低[4]。然而,实际车辆系统中的噪声特性往往不符合这一假设。因此,已经提出了各种改进算法来增强滤波器的稳定性和适应性[5]、[6]、[7]。张等人采用交互式多模型(IMM)结合CKF来实现多种运动模式下的精确实时估计[8]。王等人提出了一种鲁棒立方卡尔曼滤波器(RCKF),能够更准确地估计偏航率、侧滑角和车辆速度,显著提高了状态估计的准确性[9]。孙等人将扩展卡尔曼滤波器(EKF)与递归最小二乘(RLS)结合,共同估计车辆质量和道路坡度[10]。Kulikova等人将奇异值分解纳入最大相关准则卡尔曼滤波器(MCC-KF),增强了数值稳定性[11]。Narasimhappa等人提出了一种自适应衰减立方卡尔曼滤波器(AFCKF),通过双重衰减因子在未知噪声统计下保持估计的可靠性[12]。廖等人引入了一种自适应扩展卡尔曼滤波器(AEKF),利用创新序列调整噪声协方差,提高了对时变干扰的鲁棒性[13]。万等人构建了IMM-SCKF观测器,将IMM与平方根立方卡尔曼滤波器(SCKF)结合,保持了实时性能的同时保持了适应性和鲁棒性[14]。
除了未知噪声外,系统模型也对卡尔曼滤波器的估计性能有显著影响。从机械或数据特征的角度来看,很难准确描述自动驾驶系统的非线性关系。随着人工智能的进步,机器学习方法受到了越来越多的关注[15]、[16]。余等人将前馈神经网络与递归最小二乘结合用于车辆质量估计,提高了在不同操作条件下的稳定性。然而,手动设计的模糊融合规则限制了泛化能力[17]。白等人引入了带有非线性自回归神经元的卡尔曼滤波器,以减轻模型假设和噪声的影响[18]。Revach等人将卡尔曼滤波器结构与循环神经网络结合,提出了KalmanNet,有效解决了模型非线性和不确定性问题[19]。鲍等人使用LSTM网络和卡尔曼滤波器网络形成了深度卡尔曼滤波器网络(DKFN),增强了时间特征的表示能力[20]。张等人将物理信息深度学习(PIDL)应用于交通流模型,提高了预测准确性和鲁棒性。但性能依赖于物理模型的准确性[21]。文等人提出了一种基于残差的深度扩展卡尔曼滤波器(DREKF),提高了估计准确性和稳定性,但仍受REKF更新机制的限制[22]。肖等人将误差状态不变EKF与LSTM模型结合,实现了在干扰环境下的多传感器导航,但其对大初始偏差的鲁棒性仍然有限[23]。
传统的滤波方法基于系统动力学和观测模型,结合贝叶斯递归更新进行状态估计。通过明确定义的数学公式和物理可解释的参数,这些方法具有很强的可解释性,并且仅依赖于准确的系统模型和噪声统计信息,不需要大量的训练数据集。然而,它们的性能高度依赖于模型准确性,而且高斯分布噪声的假设在现实世界系统中往往不成立。相比之下,机器学习方法直接从数据中学习状态估计或系统动力学,无需精确建模,适用于高维和复杂系统,并且对变化的环境具有很强的适应性。然而,这些方法通常需要大量的标记数据进行训练,对数据集质量和样本量非常敏感,并且由于“黑盒”特性,在调试、可靠性验证和可解释性方面面临挑战。
近年来,混合物理-数据驱动的方法发展迅速,旨在将物理模型与数据驱动模型相结合。通常,这些方法通过将物理模型的输出作为额外的输入变量或融合两个模型的输出来提高仿真精度和物理可解释性。然而,一个显著的局限性是缺乏自适应调整机制,使得难以在物理模型和数据驱动模型之间合理分配权重。过度依赖物理模型会严重降低估计精度,而引入物理约束在极端条件或处理稀疏数据时也可能导致失败。
通过研究传统滤波算法和机器学习方法的基本原理和建模机制,本文分析了各种优化方法在处理系统非线性和未知噪声方面的优势和局限性。在此基础上,本文提出了一种混合LSTM-立方卡尔曼滤波器(HLCKF)。该方法采用经典的CKF作为框架,并集成LSTM网络进行状态预测,从而增强了模型捕捉复杂非线性系统动力学的能力,同时保持了CKF的可解释性。鉴于车辆状态(如纵向速度、横向速度、偏航率和质心侧滑角)表现出强烈的时变特性,并且属于典型的时间序列数据,因此设计了一个多输出头部和窥视耦合长短期记忆网络(MHPC-LSTM)。基于车辆动力学,该模型有效捕捉了自动驾驶系统中的复杂非线性特征并抑制了传感器测量噪声。最后,使用基于Matlab/CarSim的仿真平台,验证了MHPC-LSTM的预测性能以及所提出的HLCKF的状态估计准确性和鲁棒性。本文的主要贡献如下:
  • (1)
    与传统基于模型的滤波方法和数据驱动的机器学习技术相比,本文提出了一种混合估计框架,该框架结合了滤波模型和数据驱动方法来估计车辆时变状态。HLCKF利用神经网络揭示物理模型中的潜在非线性特征。通过有机结合数据驱动和模型驱动方法的优点,该方法实现了协同效应,从而更精确地估计车辆状态。
  • (2)
    为了有效地将物理模型纳入HLCKF框架,本文利用CKF将待估计的状态量与传感器观测量联系起来。在这个框架中,神经网络模块作为数据驱动组件嵌入到CKF中,负责表征系统的非线性和不确定性。物理模型直接集成到神经网络的训练过程中,确保其知识可以在学习阶段得到充分利用。这种方法促进了模型和数据的深度融合。
  • (3)
    为了更好地利用时间序列信息,本文基于LSTM结构提出了MHPC-LSTM模型,以改进纵向和横向状态的特征提取和时间序列依赖性建模性能。值得注意的是,遗忘门和输入门是耦合的,仅保留遗忘门,而输入门通过反向近似获得。此外,单元状态与遗忘门、输出门和输出层相连,增强了模型的表达能力。在任务建模方面,纵向和横向状态的估计任务是解耦的。采用多输出头部结构来强调状态之间的区别,并动态平衡物理模型和数据驱动模型之间的权重,以减轻纵向和横向估计任务之间的冲突。
  • 本文的其余部分组织如下:第2节建立了由车辆模型和轮胎模型组成的非线性系统模型。第3节提出了基于CKF和MHPC-LSTM的HLCKF混合估计算法结构。第4节设计仿真实验并进行比较分析。最后,第5节总结了本文并讨论了未来的研究方向。

    章节摘录

    非线性系统模型

    在自动驾驶系统中,车辆模型以轮胎力作为输入,而轮胎力受车辆状态的影响。因此,需要协同建模轮胎力。本节建立了一个三自由度(3-DOF)的非线性车辆模型和一个魔术公式轮胎模型,共同构成了自动驾驶系统的非线性模型。通过数学建模,描述了车辆的动态行为以及轮胎与

    基于CKF和MHPC-LSTM的混合估计算法HLCKF

    在本节中,我们将深入研究所提出的HLCKF估计算法架构,如图3所示。首先,介绍了一种基于模型的CKF方法,结合车辆动力学模型建立系统状态方程f和测量方程h,从而通过物理模型得出输出。然后,如第3.2节所讨论的,提出MHPC-LSTM模型作为HLCKF框架的数据驱动组件。最后,将数据驱动组件嵌入

    实验和结果

    为了定量评估算法的性能,使用均方根误差(RMSE)和平均绝对误差(MAE)作为评估指标,如方程(23)、(24)所示。此外,通过重复实验计算这些评估指标的均值和标准差(Mean ± SD)以及置信区间(CI),如方程(25)、(26)、(27)所示。为了展示实际可行性

    结论和未来工作

    本文提出了一种将深度学习与物理建模相结合的新方法,用于时变车辆状态估计。所提出的方法利用CKF建立估计状态与传感器测量值之间的映射,而神经网络模块作为数据驱动组件,消除了对物理模型微分形式的依赖。此外,基于LSTM架构开发了MHPC-LSTM模型,增强了特征

    CRediT作者贡献声明

    陈家吉:撰写——原始草案、验证、软件、方法论、概念化。胡杰:撰写——审阅与编辑、监督。张佩:撰写——审阅与编辑、监督。徐文才:撰写——审阅与编辑、形式分析。唐玉轩:撰写——审阅与编辑、形式分析。杨东浩:撰写——审阅与编辑、形式分析。

    利益冲突声明

    作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

    致谢

    本研究得到了中国湖北省重大计划(JD)项目(授权号2023BAA017)和湖北省技术创新计划(授权号2024BAB077)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号