今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

强化学习信号支持在语言切换过程中的动态自适应控制

《Communications Biology》:Reinforcement-learning signals support dynamic adaptive control during language switching

【字体: 大 中 小 】 时间:2026年06月12日 来源:Communications Biology 5.1

编辑推荐:

  摘要语言切换体现了自适应控制的一个现实世界模型,因为双语者会根据不断变化的情境需求来选择使用哪种语言。尽管自适应控制假说(Adaptive Control Hypothesis, ACH)强调了双语者的语言控制依赖于具体情境,但这些策略是如何被学习的仍不清楚。基于强化学习(Rei

  

摘要

语言切换体现了自适应控制的一个现实世界模型,因为双语者会根据不断变化的情境需求来选择使用哪种语言。尽管自适应控制假说(Adaptive Control Hypothesis, ACH)强调了双语者的语言控制依赖于具体情境,但这些策略是如何被学习的仍不清楚。基于强化学习(Reinforcement Learning, RL)理论,我们研究了奖励预测误差(Reward Prediction Error, RPE)是否驱动了自愿语言切换的行为。中英双语者完成了一个自愿的图片命名任务,该任务提供了概率性的奖励反馈(高、中、低三种概率),这些奖励反馈会根据他们的语言切换决策产生相应的RPE。计算建模显示,RPE动态地更新了一个抽象的、可泛化的语言切换策略。表征相似性分析(Representation Similarity Analysis, RSA)表明,这种控制策略的价值被存储在多任务学习(Multitask Learning, MTL)中,而RPE的表征则出现在背外侧前额叶皮层(Dorsolateral Prefrontal Cortex, dlPFC)中。此外,基于连接组的预测建模(Connectome-Based Predictive Modeling, CPM)揭示了一个多阶段的网络过程:最初是一个分布式的、跨网络的模式,用于探索性学习;随后转变为一个以中心节点为核心的模式,用于策略的利用;最后,网络进一步特化为一个局部化的电路,用于策略的自动化执行,同时还有一个全球分布的网络用于监控意外错误。这些发现共同证明了语言切换是一种基于价值的强化学习过程。这为策略学习提供了一个神经计算框架,将强化学习原理从简单的刺激-反应机制扩展到了高级认知控制领域。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:语言切换 强化学习 奖励预测误差 神经表征 动态策略 认知控制 语言切换|强化学习|奖励预测误差|神经表征|动态策略|认知控制

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号