大语言模型人格特质的心理测量学框架构建与塑造:一项面向负责任人工智能的验证研究
《Nature Machine Intelligence》:A psychometric framework for evaluating and shaping personality traits in large language models
【字体:
大
中
小
】
时间:2025年12月20日
来源:Nature Machine Intelligence 23.9
编辑推荐:
本研究针对大语言模型(LLM)合成人格特质的评估与调控需求,提出了一套系统的心理测量学方法。通过设计结构化提示策略,对18个主流LLM进行人格测试(如IPIP-NEO和BFI),并首次从可靠性、收敛效度、区分效度和效标效度多维度验证其测量质量。结果表明,大规模指令微调模型(如Flan-PaLM 540B、GPT-4o)能稳定生成符合人类心理学标准的人格数据,且通过形容词与程度词组合的提示技术可精准塑造LLM的人格表达。该框架为AI对齐、安全评估及伦理治理提供了量化工具,推动了人格理论在人工智能领域的科学应用。
随着大语言模型(LLM)在搜索引擎、写作助手和对话系统中的广泛应用,其生成文本时隐含的“合成人格”特征日益引起关注。这些模型通过海量人类语言数据训练,可能无意识地模仿特定人格倾向,例如过度讨好或攻击性回应,引发了对AI安全性、公平性及价值观对齐的担忧。然而,现有研究缺乏系统评估LLM人格特质可靠性与有效性的标准方法,且人格能否被主动调控仍未知。为此,谷歌DeepMind等机构的研究团队在《Nature Machine Intelligence》发表了首项针对LLM人格的端到端心理测量学验证研究。
为量化LLM的人格特质,研究团队设计了结构化提示框架,通过组合人物指令、传记描述和项目指导语,生成大量可控的测试变体。例如,提示模板可能包含“我的爱好是烘焙馅饼”等传记细节,并要求模型以1-5分评级“我重视合作胜过竞争”等陈述。该研究采用国际人格项目池-神经质外向开放性量表(IPIP-NEO)和大五人格量表(BFI)作为主要工具,同时引入11项外部效标测试(如PANAS情绪量表、BPAQ攻击性问卷),通过对18个LLM(包括PaLM、Llama 2、GPT等系列)进行52万次测试响应分析,评估其人格测量的心理测量学属性。
- 1.人格测试管理:通过约束生成模式(基于对数概率的选项评分)确保项目独立性,避免上下文干扰;
- 2.效度验证:采用多特质-多方法矩阵分析收敛效度与区分效度,并通过外部效标(如人格与攻击性的理论关联)检验效标效度;
- 3.人格塑造技术:基于词汇假说,使用104个人格形容词(如“沉默的”标记低外向性)和程度副词(如“极度”)构建九级提示集,独立或并发调控大五特质;
- 4.现实任务验证:让LLM生成社交媒体状态更新,通过Apply Magic Sauce API分析文本中的人格表达,对比问卷与行为数据的一致性。
- •可靠性:指令微调模型(如Flan-PaLM 62B)的Cronbach’s α系数达0.90以上,而基础模型(如PaLM 62B)的α值低于0.67,表明模型规模与微调策略显著影响测量稳定性。
- •收敛与区分效度:指令微调模型的IPIP-NEO与BFI分数相关性平均达0.80–0.90(如GPT-4o为0.90),且区分效度指标Δ≥0.40,符合心理学标准;基础模型则无显著效度证据。
- •效标效度:如图3所示,LLM的外向性与积极情绪呈正相关(r=0.74),神经质与消极情绪关联显著(r=0.69),与人类研究结果一致,且效应强度随模型规模提升。
- •单特质塑造:Flan-PaLM 540B在目标特质(如外向性)的九级提示下,IPIP-NEO分数中位数从1.07升至4.98(Δ=3.91),Spearman相关性ρ≥0.95;非目标特质则保持稳定。
- •多特质并发塑造:大型模型能同时调控所有大五特质,例如GPT-4o在“极低”与“极高”人格设定下,分数差异Δ达2.52分,而小模型(如Mistral 7B Instruct)调控能力有限(Δ<1.00)。
- •心理测试分数与LLM生成社交媒体文本的人格评分高度相关(平均r=0.67),超过人类问卷与语言行为的一致性水平(r=0.38)。词云分析显示,高神经质提示下生成文本频繁出现“抑郁”“愤怒”等词,而低神经质提示下多为“快乐”“放松”等积极词汇,证实人格塑造对生成内容的实际影响。
本研究首次为LLM人格测量建立了严谨的心理测量学标准,证明大规模指令微调模型能可靠合成人类人格特征,并通过提示工程实现精准调控。这一框架为AI伦理评估提供了新工具,例如通过人格审计预测模型在交互任务中的潜在风险,或通过特质匹配优化用户体验。然而,研究也存在局限性,如测试依赖西方文化背景的人格模型,且未考虑多轮对话中的动态人格表达。未来工作需拓展跨文化人格维度和复杂交互场景的验证,以推动负责任AI的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号