基于定量强化学习模型的行为工程:选择工程在行为塑造中的实证研究

【字体: 时间:2025年05月03日 来源:Nature Communications 14.7

编辑推荐:

  本研究通过学术竞赛形式,比较定量模型(如CATIE、QL)与定性心理学原则(如首因效应)在行为塑造中的效能。研究人员设计奖励计划以最大化偏置参与者选择,发现基于CATIE模型的"选择工程"方案(64.3%偏置率)优于传统定性方法,为认知科学模型比较提供了新范式(E[p]=61.9%),证实定量模型在行为干预中的工程化应用潜力。

  

在人类行为塑造领域,从教育实践到商业营销,传统方法长期依赖定性心理学原则(如首因效应、近因效应)或直觉经验。这种状况类似于工程学发展初期依赖"民间物理学"的阶段。随着认知科学的发展,强化学习(Reinforcement Learning, RL)等定量模型被广泛用于解释操作条件反射(operant learning)行为,但能否像物理方程指导工程建设那样,用这些模型精准"工程化"塑造行为仍属未知。

以色列Hebrew University等机构的研究团队创新性地通过学术竞赛形式,比较定量模型与定性方法在行为干预中的效能。研究设置100次二选一任务,要求各团队设计奖励计划(每选项精确奖励25次),目标是最化偏置参与者选择预设选项(Alternative 1)。通过测试11种方案(7种基于Q学习(QL)、CATIE等模型,4种基于心理学原则)对3386名参与者的影响,发现基于CATIE(Contingent Average, Trend, Inertia, Exploration)模型的方案实现64.3%选择偏置率,显著优于QL模型方案(p<0.001),与最优定性方案(64.1%)相当。该成果发表于《Nature Communications》,首次证明定量模型可直接用于行为工程,并为模型比较提供新标准。

关键技术方法包括:1)基于Amazon Mechanical Turk招募3386人完成100次二选一任务;2)采用连续拒绝法(Successive Rejects)动态分配参与者至不同奖励计划;3)通过参数化模拟比较QL(学习率η、探索参数ε)与CATIE(趋势检测τ、惯性φ等)模型;4)使用置换检验(permutation test)和bootstrap计算效应量(如d=0.394[3.310,6.169])。

研究结果:

  1. 选择工程在竞赛中的表现
    CATIE模型方案(Schedule 1)实现64.3%±0.5%选择偏置,显著优于随机水平(W=170416.5,p<0.001,r=0.822)。QL模型方案因过度依赖价值更新(式1:Qt+1(at)=Qt(at)+η(rt-Qt(at)))表现较差,验证了"强化学习的错误行为"理论。

  2. CATIE模型与最大可达偏置
    相比通过迭代优化得到的基准方案(Schedule 0,69.0%),CATIE方案存在4.7%差距(p<0.001)。模型模拟显示该差异主要源于CATIE对参与者异质性的低估(实测SD=11.2% vs 预测10.0%),而非优化失败(CATIE内测试:Schedule 1达71.61%)。

  3. 选择工程与模型比较
    在预测整体偏置方面,CATIE相关性r=0.88显著优于QL(p<0.001);但在个体选择预测中,CATIE仅以E[p]=61.9%微弱领先QL(61.8%)。值得注意的是,标准似然比较(E[log(p)])中QL反超,揭示模型评价需多维度考量。

讨论与意义:
该研究开创性提出"选择工程"概念,类比自然科学中数学模型指导工程实践的模式。CATIE模型的成功挑战了QL在操作条件反射领域的主导地位——尽管CATIE缺乏机器学习领域的理论保障,其多模态决策机制(趋势探测、惯性等)更贴合人类行为异质性。研究方法上,通过工程竞赛形式首次实现定性原则与定量模型的直接比较,克服了传统似然比较无法跨范式评价的局限。

实践层面,证明仅需模型无需大数据即可实现行为干预(如将探索概率p_explore与预测误差动态关联)。伦理方面,作者强调需审慎应用该技术,因其效果受任务约束(如固定奖励次数)限制。未来可扩展至动态奖励分配场景,推动认知模型从解释性工具向工程化解决方案的转化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号