基于强化学习的自适应学习:考虑学习持续时间的奖励优化

《British Journal of Mathematical and Statistical Psychology》:Reinforcement learning-based adaptive learning: Rewards improvement considering learning duration

【字体: 时间:2025年10月25日 来源:British Journal of Mathematical and Statistical Psychology 1.8

编辑推荐:

  基于强化学习的自适应学习系统通过改进奖励机制,综合考虑学习材料有用性与个体知识基础所需时间投入,经蒙特卡洛模拟验证,显著缩短学习时间并提升不同知识水平学习者的效率。

  

摘要

强化学习(RL)是自适应学习系统的核心,它能够根据学习者的不同学习状态推荐个性化的学习材料,从而优化学习效果。然而,有人认为仅仅提高学习效果可能还不够,尤其是当这会过度增加学习者的学习负担并需要额外时间来掌握推荐材料时。具有不同先前知识水平的学习者,在学习相同材料时所花费的时间也不同。因此,设计者应同时考虑材料的实用性以及具有特定先前知识水平的学习者理解材料所需的时间。为了解决这一问题,本研究提出了一种基于强化学习的自适应学习系统,该系统通过综合考虑这两个因素来改进奖励机制。随后,我们通过蒙特卡洛仿真实验验证了改进后的奖励机制的效果,并揭示了强化学习推荐策略的运作机制。实验结果表明,改进后的奖励机制由于提供了可解释的推荐策略,显著缩短了学习者的学习时间,从而提高了具有不同先前知识水平的学习者的学习效率。

利益冲突声明

我们没有需要披露的利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号