折扣无限视界平均场博弈的策略迭代方法:半拉格朗日方法

《Science China-Information Sciences》:Policy iteration method for discounted infinite horizon mean field games: the semi-Lagrangian approach

【字体: 时间:2025年11月06日 来源:Science China-Information Sciences 7.6

编辑推荐:

  政策迭代方法用于求解折扣无限期均场博弈,在连续层面通过该方法证明大折扣因子λ下解的存在唯一性,离散层面实现计算。采用半拉格朗日方法,先基于动态规划原理时间离散化,再空间投影到网格。通过一维和二维数值案例验证理论结果。

  

摘要

我们研究了用于求解贴现无限视界平均场博弈的政策迭代方法。在连续层面,政策迭代算法可用于确定具有较大贴现因子λ的平均场博弈解的存在性和唯一性。在离散层面,该算法可用于计算问题的解。为了实施这一方法,我们采用了半拉格朗日方法:首先利用动态规划原理对哈密顿-雅可比-贝尔曼方程进行时间离散化,然后再通过投影到网格上来实现空间离散化。为了验证我们的理论发现,我们提供了一维和二维情况下的数值示例。

我们研究了用于求解贴现无限视界平均场博弈的政策迭代方法。在连续层面,政策迭代算法可用于确定具有较大贴现因子λ的平均场博弈解的存在性和唯一性。在离散层面,该算法可用于计算问题的解。为了实施这一方法,我们采用了半拉格朗日方法:首先利用动态规划原理对哈密顿-雅可比-贝尔曼方程进行时间离散化,然后再通过投影到网格上来实现空间离散化。为了验证我们的理论发现,我们提供了一维和二维情况下的数值示例。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号