"Centaur:基于大规模心理实验数据构建的人类认知基础模型"

【字体: 时间:2025年07月04日 来源:Nature 50

编辑推荐:

  这项研究针对传统认知模型领域特异性局限,开发了名为Centaur的基础模型。研究人员通过微调Llama 3.170B语言模型,在包含160项心理实验、超1000万次选择的Psych-101数据集上训练,首次实现了跨领域人类行为预测。该模型不仅超越领域特异性认知模型(如prospect theory),其内部表征与人类神经活动更趋一致,为建立统一认知理论提供了新范式。

  

人类认知的复杂性长期困扰着研究者——我们既能选择早餐麦片,又能攻克癌症,但现有认知模型却像"专精单一游戏的AlphaGo",无法跨越领域界限。传统理论如前景理论(prospect theory)仅解释决策行为,强化学习模型只适用于特定任务,这种碎片化现状与认知的通用性形成尖锐矛盾。正如Newell和Simon早在1972年预言:唯有建立统一理论,才能整合日益增长的知识体系。

来自马克斯·普朗克研究所等机构的Marcel Binz团队在《Nature》发表突破性研究,通过构建首个通用人类认知基础模型Centaur,实现了跨160种实验范式、超60,000名参与者行为的高精度预测。该模型基于Psych-101数据集——这个包含10,681,650次选择、253,597,411文本标记的巨型语料库,采用参数高效的QLoRA技术微调Llama 3.170B语言模型,仅添加0.15%的可训练参数(低秩适配器rank=8),便使模型在五天训练后获得人类行为预测能力。

关键方法

  1. 数据构建:将160项心理实验(如多臂老虎机、两阶段任务)转化为自然语言格式的Psych-101数据集
  2. 模型架构:基于Llama 3.170B添加低秩适配器(r=8),采用交叉熵损失函数进行单周期训练
  3. 评估体系:通过负对数似然比较模型性能,使用fMRI数据验证神经表征对齐

模型性能验证
"Centaur captures human behaviour"部分显示,模型在留出参与者测试中,负对数似然(0.44)显著优于基线模型(0.58,P≤0.0001)。在开放循环模拟中,模型生成的探索行为分布与人类高度吻合(定向探索参数t检验P=0.02)。特别值得注意的是,在预测非人类智能体行为时准确率骤降至35%,证实其人类特异性。

泛化能力突破
"Probing generalization abilities"章节揭示,模型在三种严格测试中表现卓越:

  1. 封面故事变更:从未接触魔法地毯叙事的Centaur,在改编版两阶段任务中预测准确率(负对数似然0.42)仍优于专用模型(0.61)
  2. 结构修改:面对训练集未包含的三臂老虎机任务"Maggie's farm",模型表现(0.42)远超传统模型(0.98)
  3. 全新领域:在未训练过的逻辑推理任务(LSAT题型)中,性能提升23%(Cohen's d=0.23)

神经科学启示
"Alignment to human neural activity"通过两项fMRI分析发现:

  1. 双阶段任务中,Centaur表征对纹状体(特别是伏隔核)神经活动的预测相关性显著增强(所有层P≤0.001)
  2. 句子阅读任务中,模型中间层(约20层)与语言网络神经活动的解码相关性经元分析证实存在微幅提升(β=0.007,P=0.045)

理论构建新范式
"Model-guided scientific discovery"展示的案例中,通过DeepSeek-R1解析出"多数正评分优先,专家权重断后"的双启发式策略,经科学后悔最小化(scientific regret minimization)优化后,新模型的AIC(71.7)既匹配Centaur预测力,又保持可解释性,保护超越概率达83%。

这项研究标志着认知科学进入"基础模型"时代——Centaur不仅验证了通过数据驱动发现统一认知理论的可能性,其"预训练+微调"范式更为理解复杂行为提供了新工具。正如作者强调,当模型在16个"认知十项全能"中全部获胜时,传统领域特异性理论的局限性已不言自明。未来,随着Psych-101向发育心理学、计算精神病学等领域扩展,这种融合语言模型与认知科学的研究路径,或将成为揭示智能本质的关键突破口。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号