可达集一致系统辨识:从白箱到黑箱模型的统一框架

《IEEE Transactions on Automatic Control》:Reachset-Conformant System Identification

【字体: 时间:2025年11月22日 来源:IEEE Transactions on Automatic Control 7

编辑推荐:

  本文针对复杂信息物理系统安全验证中模型与真实系统行为一致性的关键问题,提出了可达集一致系统辨识的创新框架。研究团队突破了现有方法仅适用于线性状态空间模型的局限,首次将可达集一致辨识推广至非线性状态空间模型及输入输出模型(ARX/NARX),并实现了基于数据的黑箱模型辨识。通过引入通用线性输出(GLO)逼近技术,将非线性系统可达集计算转化为线性规划问题,显著提升了计算效率。实验验证表明,该方法在保证安全属性可传递性的同时,能获得更紧凑的不确定性集合,为自动驾驶车辆等安全关键系统的可靠验证提供了新途径。

  
在当今复杂的信息物理系统(如自动驾驶车辆、工业机器人)中,形式化验证技术扮演着确保系统安全的关键角色。然而,这些验证结果能否真正应用到现实世界,很大程度上取决于数学模型与真实系统之间的一致性。传统系统辨识方法通常基于概率假设,但在许多实际应用中,我们往往缺乏关于数据不确定性的先验分布信息。更关键的是,为了在规划和控制中建立严格的安全保证,我们需要具有有界不确定性的模型。
现有研究面临三重挑战:首先,大多数可达集一致辨识方法仅限于线性状态空间模型;其次,对于输入输出模型(如ARX、NARX)的可达集一致辨识尚未有研究涉及;第三,完全基于数据的黑箱模型辨识仍是一片空白。这些局限性严重制约了形式化验证技术在复杂系统中的应用广度与深度。
针对这些挑战,慕尼黑工业大学的Laura Lützow和Matthias Althoff在《IEEE Transactions on Automatic Control》上发表了开创性研究,提出了一个统一的可达集一致系统辨识框架。该研究的核心创新在于引入了通用线性输出(GLO)逼近技术,使得非线性系统的可达集计算能够通过线性规划高效解决,从而实现了从白箱到黑箱不同知识水平下的系统辨识。
研究人员开发了三个层次的方法:对于已知模型结构的白箱辨识,通过线性规划直接优化不确定性集合;对于部分参数未知的灰箱辨识,结合非线性规划与线性规划交替优化;对于完全未知的黑箱辨识,采用改进的遗传编程(CGP)算法,在最小化预测误差的同时考虑模型的可达集大小。特别值得关注的是,研究团队还提出了基于生成器约束的优化方法,有效解决了高维系统计算复杂度的瓶颈问题。
关键技术方法包括:1)通用线性输出(GLO)逼近技术,将非线性系统输出线性化;2)基于zonotope(带形多面体)集合表示的不确定性量化;3)结合半空间约束和生成器约束的线性规划优化;4)序列式灰箱辨识算法(GraySeq);5)符合性遗传编程(CGP)黑箱辨识方法。实验使用了模拟数据和真实世界自动驾驶车辆数据验证。

可达集计算与GLO逼近

研究团队提出了通用线性输出(GLO)逼近方法,将非线性系统的输出函数沿参考轨迹进行线性化。对于状态空间模型,通过泰勒展开得到系统矩阵和输入矩阵;对于输入输出模型,则通过扩展状态空间表示实现线性化。这种方法使得非线性系统的可达集计算可以转化为线性变换问题,大大降低了计算复杂度。值得注意的是,当系统为线性时,线性化误差为零,GLO逼近给出精确结果。

白箱模型辨识性能

实验结果表明,白箱辨识方法在所有测试系统上都能获得接近真实不确定性集合的结果。对于线性系统(如行人模型),辨识出的不确定性集合与真实集合完全一致,可达集紧密包围所有测量数据。对于非线性系统(如Lorenz系统),由于线性化误差的存在,辨识结果相对保守,但仍在可接受范围内。与仅考虑加性不确定性的基线方法相比,本文提出的方法在非线性系统上表现出明显优势,特别是在处理复杂不确定性传播时。

灰箱模型辨识比较

在灰箱辨识方面,序列式方法(GraySeq)在大多数系统上表现最优,同时保持了合理的计算时间。相比同时优化方法(GraySim),GraySeq在保持精度的同时将计算时间减少了约40%。使用最小二乘成本函数的变体(GraySeq2)虽然计算最快,但会导致更大的可达集,这表明考虑最大误差的成本函数设计对获得紧凑不确定性集合至关重要。

黑箱模型辨识创新

黑箱辨识实验中,符合性遗传编程(CGP)方法显著优于传统GP方法。对于Lorenz系统,CGP方法获得的归一化成本比传统方法低约50%,且失败率大幅降低。这主要是因为CGP在进化过程中同时考虑模型预测精度和可达集大小,避免了可能产生爆炸性可达集的模型结构。该方法为完全基于数据的系统辨识开辟了新途径。

实际应用验证

在自动驾驶车辆EDGAR的实车数据验证中,白箱和灰箱方法分别实现了98.9%和93.6%的测量数据包含率。即使对于未参与辨识的测试案例,辨识出的模型也能保持较好的泛化能力。通过引入安全因子(ε=1.2),包含率可进一步提升至99.2%以上,证明了该方法在实际系统中的鲁棒性和实用性。
本研究建立了完整的可达集一致系统辨识理论框架和技术体系,首次实现了从线性到非线性、从状态空间到输入输出模型、从白箱到黑箱的全谱系辨识能力。GLO逼近技术的引入为非线性系统可达集计算提供了统一而高效的解决方案,而基于不同约束形式的优化方法则平衡了计算复杂度与精度需求。实验结果表明,该框架在不同类型的动态系统上均表现出色,特别是在处理真实世界系统的不确定性时展现出了强大优势。
这项工作的重要意义在于,它为复杂信息物理系统的安全验证提供了实用的模型基础,使得形式化验证结果能够更可靠地转移到实际应用中。未来研究方向包括建立结果的概率保证、处理异常值以及扩展到更广泛的系统类别。尽管如此,当前的研究成果已经为提升现实世界系统的可靠性和安全性做出了重要贡献,特别是在自动驾驶等安全关键领域具有广阔的应用前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号