通过遗传编程和大型语言模型辅助的课程学习进行策略搜索

《ACM Transactions on Evolutionary Learning and Optimization》:Policy Search through Genetic Programming and LLM-assisted Curriculum Learning

【字体: 时间:2025年11月08日 来源:ACM Transactions on Evolutionary Learning and Optimization

编辑推荐:

  课程学习(CL)通过多样化用户提供的难度递进且有序的测试用例优化策略搜索。本研究评估大型语言模型(LLMs)作为GP优化策略的测试用例生成器,在单人和多人游戏中使用四类LLMs生成测试用例,实验表明LLM辅助CL的有效性取决于模型选择、提示设计和调度策略,为自动化课程设计提供关键启示。

  

摘要

课程学习(Curriculum Learning, CL)是指利用用户提供的多样化测试用例来学习策略,这些测试用例具有不同的难度级别,并按照适当的顺序组织起来。测试用例的质量对于遗传编程(Genetic Programming, GP)等优化技术解决策略搜索问题至关重要。在这项研究中,我们评估了大型语言模型(Large Language Models, LLMs)作为基于GP的策略搜索测试用例提供者的能力。我们考虑了两种策略搜索任务:单人游戏和多人游戏,并使用了四种在复杂性和专业化方面各不相同的LLMs,通过对其进行引导来生成适用于这两种游戏的测试用例。我们通过实验评估了LLM生成的测试用例本身的质量及其在遗传编程优化过程中的实用性。我们还评估了该方法在测试用例安排方式以及策略表示方式(我们使用了由GP进化得到的图和线性程序)方面的鲁棒性。研究发现,LLM辅助的课程学习的有效性既取决于LLM的选择,也取决于引导和调度策略的设计。这些发现为在基于GP的自动化课程设计中利用LLMs提供了重要的参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号