近几十年来,正念已成为科学探究和临床实践的重要焦点,吸引了多个学科的持续关注(Bunjak等人,2022年)。正念最初源于冥想传统,如今在心理学(Tomlinson等人,2018年)、医学(Creswell等人,2019年)、教育学(Weare,2019年)和神经科学(Treves等人,2024年)等领域得到研究。标准化正念干预措施和基于证据的程序的发展进一步推动了对其对心理健康和幸福感影响的研究(Galante等人,2021年;Goldberg等人,2018年),促进了其在临床和非临床环境中的应用。
随着正念研究的扩展,对概念清晰度的需求变得越来越重要。虽然正念植根于佛教思想,但其心理学解释已进行了重大调整,以适应世俗科学背景(Ditrich,2016年)。一个广泛接受的正念定义将其描述为“通过有意地、非评判性地关注每一刻的体验而产生的觉知”(Kabat-Zinn,2003年,第145页)。然而,存在多种不同的定义(Nilsson & Kazemi,2016年),这些定义的多样性影响了正念的测量和应用方式。为了提高清晰度,研究人员在现有概念基础上提出了一个更为精细的定义(Chems-Maarif等人,2025年)。
这一新定义提出了两项改进:(a)正念的四个范畴(即身体感觉、情感价值、认知和情绪、外部感官现象),这些范畴代表了正念可以应用的当下觉知的具体维度;(b)两个态度组成部分,将之前认为对正念至关重要的各种态度整合为两个关键方面。这两个态度组成部分是:(1)接纳态度,表现为对体验的开放和接受,不抗拒也不回避;(2)平等态度,反映了对波动体验的平衡、镇定和平和,允许它们自然发展而不产生反应或依附。这些组成部分共同构成了正念的定义,即“以接纳和平等的态度,关注身体感觉、情感价值、认知和情绪现象以及外部环境”的当下中心觉知(Chems-Maarif等人,2025年,第15页)。这一框架为将正念视为一种特质(反映稳定的个体差异)或一种状态(反映个体在不同时间和情境下的短暂变化)提供了基础。因此,它构成了本研究的概念基础。
考虑到理论和定义在心理学测量工具开发和评估中的核心作用(Clark & Watson,2019年),概念清晰度对于任何连贯有效的正念评估都是必要的。尽管现有工具基于不同的定义,但应用一个清晰且理论整合的框架对于系统地评估它们如何捕捉正念的核心维度至关重要。这种方法在概念一致性缺乏(Park等人,2013年)和工具间可比性有限(Bergomi等人,2013年)的领域尤为重要,这两者一直是正念研究及其临床应用进展的持续障碍(Van Dam等人,2018年)。
与许多心理学概念一样,正念本身不可直接观察,但可以通过精心设计的测量工具来推断。特别是在正念研究及其临床应用中,这类测量工具非常重要,原因包括:(a)评估个体或群体的正念状况并进行相应分类;(b)总结和传达有关正念的信息;(c)阐明正念的核心概念和结构;(d)理解正念与其他相关心理学概念之间的联系;(e)测量基于正念的干预措施和程序的效果;(f)确定其内容;(g)评估其作用机制。
目前,自我报告工具主导了正念测量领域。值得注意的是,也提出了其他方法,包括行为测量(Levinson等人,2014年)、神经生理测量(Hadash & Bernstein,2019年)和观察者评分方法(Bartlett等人,2022年)。然而,这些方法不在本文讨论范围内。鉴于自我报告工具的广泛使用,它们仍是本评价的重点。重要的是,这些量表基于坚实的理论基础(Quaglia等人,2015年)。它们的流行之处在于具有实际优势,如易于管理和大规模应用,同时能够多方面探索正念的主观方面。这些工具通常既包括“什么”(即对当下体验的关注和觉知),也包括“如何”(即以好奇心、接纳和非评判的态度)(Bishop等人,2004年)。
已经开发出多种适用于不同人群和情境的测量工具,包括为有经验的冥想实践者设计的工具(例如Freiburg正念量表;Buchheld等人,2001年)、临床人群(例如认知和情感正念量表修订版;Feldman等人,2007年)、普通人群(五因素正念问卷;Baer等人,2006年),以及儿童和青少年(例如儿童和青少年正念测量工具;Greco等人,2011年),许多量表提供长式和短式版本(例如Baer等人,2006年;Baer等人,2012年;Bohlmeijer等人,2011年)。此外,还对现有自我报告工具进行了大量改编和翻译,从而提高了它们的可访问性、包容性和跨研究情境的普遍适用性。
除了目标人群和格式的不同,正念测量工具所评估的心理时间框架也各不相同。大多数工具将正念视为一种特质,而有些工具则将其视为一种波动的状态(例如多伦多正念量表;Lau等人,2006年;四方面正念问卷;Raynes & Dobkins,2025年)。现有的测量工具通常包含一系列按频率(例如“从未”到“总是”)或同意程度(例如“完全不适用于我”到“非常适用于我”)评分的陈述,通过汇总各项得分来生成总正念得分或特定方面的得分。特质测量通常通过询问一般倾向(Baer等人,2006年)或过去几周的体验(Karl等人,2024年)来研究正念,而状态测量则通过参考一天中的体验(Lacaille等人,2015年)或直接的即时体验(Lau等人,2006年)来进行评估。
鉴于正念测量工具的多样性,系统评价对于整合现有证据、澄清心理测量学特性和识别当前正念评估中的空白至关重要。以往的系统评价显著提高了我们对各种量表心理测量学优缺点的理解。据作者所知,近年来进行了多项关于正念测量的系统评价,重点关注成人量表(Gherardi-Donato等人,2020年;Miller等人,2024年;Park等人,2013年;Sauer等人,2013年)和儿童及青少年量表(Bender等人,2023年;Goodman等人,2017年;Pallozzi等人,2017年)。
目前,只有一项系统评价旨在根据既定的心理测量学质量标准评估正念工具(Park等人,2013年)。该评价指出了所有量表在内容效度方面的严重问题,包括正念定义的不一致性、在量表开发过程中与目标人群的互动有限(例如专家参与度不足),以及对概念覆盖的不清晰。尽管这项工作对该领域有重要贡献,但其范围有限,仅评估了10个量表在六个心理测量学属性上的表现,并排除了短式版本。此外,没有使用统一的指导性定义作为评估工具是否捕捉到正念核心特征的参考标准。总体而言,这种结构化的评估缺乏限制了确定正念工具心理测量学稳健性、识别剩余空白以及评估该领域进展的能力。
鉴于近年来心理测量学研究的快速发展,显然需要更新和严格评估现有的自我报告正念工具。本评价通过对现有工具进行全面的系统评估,应用既定的质量标准和最新的综合定义,以提高概念清晰度,增强方法论标准,并支持跨理论多样工具的比较,从而为未来的研究和临床实践提供指导。