
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"Centaur:基于大规模心理实验数据构建的人类认知基础模型"
【字体: 大 中 小 】 时间:2025年07月04日 来源:Nature 50
编辑推荐:
这项研究针对传统认知模型领域特异性局限,开发了名为Centaur的基础模型。研究人员通过微调Llama 3.170B语言模型,在包含160项心理实验、超1000万次选择的Psych-101数据集上训练,首次实现了跨领域人类行为预测。该模型不仅超越领域特异性认知模型(如prospect theory),其内部表征与人类神经活动更趋一致,为建立统一认知理论提供了新范式。
人类认知的复杂性长期困扰着研究者——我们既能选择早餐麦片,又能攻克癌症,但现有认知模型却像"专精单一游戏的AlphaGo",无法跨越领域界限。传统理论如前景理论(prospect theory)仅解释决策行为,强化学习模型只适用于特定任务,这种碎片化现状与认知的通用性形成尖锐矛盾。正如Newell和Simon早在1972年预言:唯有建立统一理论,才能整合日益增长的知识体系。
来自马克斯·普朗克研究所等机构的Marcel Binz团队在《Nature》发表突破性研究,通过构建首个通用人类认知基础模型Centaur,实现了跨160种实验范式、超60,000名参与者行为的高精度预测。该模型基于Psych-101数据集——这个包含10,681,650次选择、253,597,411文本标记的巨型语料库,采用参数高效的QLoRA技术微调Llama 3.170B语言模型,仅添加0.15%的可训练参数(低秩适配器rank=8),便使模型在五天训练后获得人类行为预测能力。
关键方法
模型性能验证
"Centaur captures human behaviour"部分显示,模型在留出参与者测试中,负对数似然(0.44)显著优于基线模型(0.58,P≤0.0001)。在开放循环模拟中,模型生成的探索行为分布与人类高度吻合(定向探索参数t检验P=0.02)。特别值得注意的是,在预测非人类智能体行为时准确率骤降至35%,证实其人类特异性。
泛化能力突破
"Probing generalization abilities"章节揭示,模型在三种严格测试中表现卓越:
神经科学启示
"Alignment to human neural activity"通过两项fMRI分析发现:
理论构建新范式
"Model-guided scientific discovery"展示的案例中,通过DeepSeek-R1解析出"多数正评分优先,专家权重断后"的双启发式策略,经科学后悔最小化(scientific regret minimization)优化后,新模型的AIC(71.7)既匹配Centaur预测力,又保持可解释性,保护超越概率达83%。
这项研究标志着认知科学进入"基础模型"时代——Centaur不仅验证了通过数据驱动发现统一认知理论的可能性,其"预训练+微调"范式更为理解复杂行为提供了新工具。正如作者强调,当模型在16个"认知十项全能"中全部获胜时,传统领域特异性理论的局限性已不言自明。未来,随着Psych-101向发育心理学、计算精神病学等领域扩展,这种融合语言模型与认知科学的研究路径,或将成为揭示智能本质的关键突破口。
生物通微信公众号
知名企业招聘