
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ISC-POMDPs:具有初始状态依赖成本的部分观测马尔可夫决策过程
《IEEE Control Systems Letters》:ISC-POMDPs: Partially Observed Markov Decision Processes With Initial-State Dependent Costs
【字体: 大 中 小 】 时间:2025年11月13日 来源:IEEE Control Systems Letters 2
编辑推荐:
部分观测马尔可夫决策过程(POMDP)中引入了初始状态成本(ISC-POMDPs),通过递归贝叶斯固定点平滑器估计未知初始状态,并将其转化为信念依赖成本问题,在机器人导航和主动感知等场景中验证了控制策略的有效性。
动态系统的初始状态通常具有重要的实际意义[1]、[2]、[3]、[4]。例如,车辆的初始位置通常对应于其所有者的居住地[1];机器人的初始姿态有助于实现安全或可恢复的导航、路径规划和地图构建[2]、[3];而代理团队的初始配置有助于识别它们的角色或意图[4]。这种重要性催生了与初始状态直接相关的部分观测随机最优控制问题,例如在网络控制系统中控制系统以阻碍对其初始状态的推断从而保护隐私[1],或者在目标跟踪和机器人技术中控制系统以改善对其初始状态的推断从而实现主动感知[2]、[3]、[4]。然而,目前还缺乏解决初始状态目标问题的一般框架。因此,我们提出并研究了初始状态成本部分观测马尔可夫决策过程(ISC-POMDP)。
生物通微信公众号
知名企业招聘