基于BERT语言模型的自由文本分析:量化自我关怀心理特征的新方法

【字体: 时间:2025年07月17日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对传统自我关怀(SCS/CEAS)量表测量易受问卷偏差影响的问题,开发了基于BERT模型的自由文本分析方法。研究人员通过收集挑战情境下的短文本(780名日本参与者),成功预测SCS总分(r=0.67)和CEAS得分(r=0.42),证实自然语言处理可有效量化心理特质,为心理评估提供更生态化的测量工具。

  

在当代快节奏生活中,人们面临各种心理压力,如何善待自己成为重要课题。自我关怀(Self-compassion)作为心理学热点概念,指个体在困境中对自己保持善意和理解的能力。传统测量主要依赖自评量表如自我关怀量表(SCS)和关怀参与行动量表(CEAS),但这些工具存在明显局限:问卷项目可能暗示"正确答案",在东亚文化背景下尤其容易引发社会赞许性偏差;且固定选项难以捕捉个体表达的真实丰富性。

京都大学教育学研究科的研究团队创新性地将自然语言处理(NLP)技术引入心理测量领域。他们发现,人们在日常生活中更习惯用语言而非数字量表表达情感,自由文本可能提供更真实、更少偏差的心理状态反映。随着深度学习技术的发展,特别是基于Transformer架构的BERT模型在情感分析等任务中展现出强大性能,这为心理特质的文本量化提供了新可能。

研究团队通过日本众包平台招募780名参与者,设计12个情境化提示(如"当意识到自身缺点时,你通常会怎么想?"),收集短文本回答并同步测量SCS、CEAS等量表。采用嵌套交叉验证方法,对日文预训练BERT模型进行微调,建立从自由文本预测量表得分的回归模型。结果显示:关于"自我想法"的文本组合预测SCS总分准确度最高(r=0.67),证实自我关怀特质能通过语言特征有效捕捉;而CEAS得分预测(r=0.42)显示行为导向量表的文本预测更具挑战性。预测得分与传统量表在抑郁(PHQ-9)、压力(PSS)等校标上呈现相似相关模式,验证了方法的效度。

关键技术包括:1) 设计情境化自由文本收集方案(3种困境×4类问题);2) 使用日文预训练BERT-base模型进行微调;3) 采用嵌套5折交叉验证优化超参数;4) 通过文本组合策略提升预测性能。

主要研究发现:

"自我关怀总分预测"部分显示,涉及自我认知的文本(如"对自身的想法")预测效果最佳,情境组合文本预测优于单一情境。特别是"意识到缺点时对自我的想法"提示获得最高预测精度(r=0.57),表明该情境最能激发自我关怀的语言表达。

"SCS子量表预测"部分表明,自我评判(Self-Judgement)和过度认同(Over-Identification)子量表预测效果较好(r≈0.6),而自我善意(Self-Kindness)预测较弱,可能反映日本文化中自我批评表达更普遍。

"CEAS总分预测"部分发现,行为描述文本预测效果(r=0.35-0.41)优于认知类文本,印证CEAS更侧重行为测量的特性。

"预测分数与传统量表关系"部分证实,BERT预测得分与PHQ-9、PANAS等变量的相关模式与传统量表基本一致,但相关系数绝对值偏小,反映文本测量与传统问卷既相关又独特的特性。

这项发表在《Scientific Reports》的研究具有多重意义:方法学上,首次证明短自由文本能有效量化复杂心理建构,突破传统量表限制;理论上,发现自我关怀表达存在情境特异性,支持动态特质观;应用层面,为减少测量偏差提供新思路,特别适合跨文化研究。未来可扩展至临床评估、员工心理监测等领域,但需注意样本的文化特异性。研究也提示,结合多种文本情境能提升预测效果,这为心理测量研究设计提供了重要启示。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号