基于大语言模型与人工人格的个性化测试开发框架研究

【字体: 时间:2025年08月04日 来源:Journal of Research in Personality 3.1

编辑推荐:

  本研究创新性地利用大语言模型(LLMs)构建人格测试初筛体系,通过人工人格(APs)模拟生成自尊量表(AP-SE)和大五人格模型(FFM)量表。AI构建的量表在人类测试中展现出良好信效度(Cronbach's α=0.84),与罗森伯格自尊量表(RSES)和NEO人格量表修订版(NEO-PI-R)具有显著相关性,为心理学量表开发提供了高效新范式。

  

Highlight

参与者

研究1未使用人类受试者。

流程

自尊人格创建:首先利用ChatGPT生成包含职业(如教师、银行经理等)、爱好(如电子游戏、国际象棋等)和未来期望(如购房、旅行等)的随机组合,构建1000个具有不同特征的人工人格(APs)。

结果

人工人格-自尊量表(AP-SE)项目筛选:通过将1000个国际人格项目池(IPIP)条目与APs的自尊水平(0=低自尊,1=高自尊)进行相关性分析,筛选出40个最具判别力的条目进行主成分分析(PCA)。该筛选流程完全规避了人类主观判断的干扰。

参与者与流程

从尤金-斯普林菲尔德社区招募449名22-90岁成年人,通过邮寄问卷方式收集数据。受试者平均接受过2年高等教育,在1994年起的三年间完成了IPIP条目、AP-SE/AP-FFM量表及罗森伯格自尊量表(RSES)等测试。

结果

AP-SE的聚合与区分效度:20项AP-SE量表在人类测试中展现出令人满意的内部一致性(Cronbach's α=0.84),其信度水平与杰克逊人格量表修订版(JPI-R)、UCLA孤独量表和状态-特质焦虑量表(STAI)等经典量表相当。

局限性

人工人格(APs)难以完全复现人类人格的复杂多样性。虽然大语言模型(LLMs)能模拟人格测试反应,但在捕捉人类情感行为谱系和文化差异方面存在局限,这主要受限于训练数据集的覆盖广度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号