
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通过递归学习和策略梯度方法,实现稳定性认证的基于策略的数据驱动LQR控制
《Automatica》:Stability-certified on-policy data-driven LQR via recursive learning and policy gradient
【字体: 大 中 小 】 时间:2026年06月09日 来源:Automatica 5.9
编辑推荐:
Lorenzo Sforni|Guido Carnevale|Ivano Notarnicola|Giuseppe Notarstefano摘要在本文中,我们研究了一种数据驱动的框架,用于解决动态未知情况下的线性二次调节器(LQR)问题,并且还额外提供了整个学习和控制方案的稳定性
生物通微信公众号