正念评估中总分过度使用的反思:基于种族/民族、年龄和PTSD诊断的总分与 moderated nonlinear factor analysis 评分比较

《Prevention Science》:Being Mindful About Overuse of Total Scores: a Comparison of Total Scores and Moderated Nonlinear Factor Analysis Scores in Assessing Mindfulness Across Race/Ethnicity, Age, and PTSD Diagnosis

【字体: 时间:2025年12月10日 来源:Prevention Science 2.7

编辑推荐:

  本研究针对正念干预评估中普遍依赖总分(sum/total scores)的局限性,探讨了测量非不变性/项目功能差异(MNI/DIF)对正念评估的影响。研究人员以接受物质使用障碍(SUD)住院治疗的女性为样本,比较了 moderated nonlinear factor analysis(MNLFA)评分与总分模拟模型(TSA)在 Five Facet Mindfulness Questionnaire(FFMQ)各因子评估上的差异。结果发现,年龄、PTSD诊断、非西班牙裔黑人、西班牙裔等群体存在显著的MNI/DIF。MNLFA模型揭示了PTSD诊断与西班牙裔身份对“acting with awareness”、“describing”、“observing”等潜在因子的真实影响,而TSA模型则可能高估了西班牙裔参与者在“describing”和“observing”因子上的差异,或漏检了PTSD患者在“acting with awareness”上的差异。该研究强调了在跨群体比较中采用先进心理测量学方法以纠正测量偏差、确保评估准确性的重要性,对提升正念干预研究的科学性与公平性具有重要意义。

  
在当代健康医学领域,正念(Mindfulness)作为一种关注当下、有目的且不评判的注意力品质,日益受到重视。基于正念的干预措施(Mindfulness-Based Interventions, MBIs)在预防和减轻焦虑、抑郁、物质使用等压力相关状况方面展现出初步积极效果。然而,一个关键问题随之浮现:我们如何准确衡量“正念”这一复杂构念?目前,最广泛使用的工具之一是五因素正念问卷(Five Facet Mindfulness Questionnaire, FFMQ),它评估观察(Observing)、描述(Describing)、有意识地行动(Acting with Awareness)、不评判(Non-Judging)和不反应(Non-Reactivity)五个维度。但遗憾的是,绝大多数相关研究和评估都依赖于将问卷各项目得分简单相加得到总分(Sum or Total Scores)或各维度分。这种便捷的方法背后隐藏着巨大风险:它默认每个项目对总分的贡献权重相等,且忽略了测量工具在不同人群(如不同种族/民族、年龄、或患有特定心理疾病如创伤后应激障碍[Post-Traumatic Stress Disorder, PTSD]的个体)中可能存在的理解差异和反应偏差,即测量非不变性或项目功能差异(Measurement Noninvariance/Differential Item Functioning, MNI/DIF)。当存在MNI/DIF时,观察到的组间差异可能并非反映了真实的心理特质水平差异,而是测量工具本身的“偏见”所致。这对于旨在公平有效地评估MBIs效果,特别是在服务不足或具有独特文化背景的群体(如西班牙裔[Hispanic]人群)中,构成了严峻挑战。为了解决这一问题,由Alyssa Lozano、Lissette M. Saavedra、Tara G. Bautista、Mariana Sanchez、Antonio A. Morgan-López和Hortensia Amaro组成的研究团队在《Prevention Science》期刊上发表了他们的最新研究。
研究人员利用一项大型随机临床试验的基线数据,该试验的对象是245名处于物质使用障碍(Substance Use Disorder, SUD)住院治疗阶段的女性。他们聚焦于FFMQ,采用了一种更为先进的心理测量学方法——调节非线性因子分析(Moderated Nonlinear Factor Analysis, MNLFA),来检验在种族/民族(非西班牙裔白人[Non-Hispanic White]、非西班牙裔黑人[Non-Hispanic Black]、西班牙裔[Hispanic]和其他种族/民族)、年龄(连续变量)以及PTSD诊断这些分组变量上是否存在MNI/DIF。MNLFA的优势在于,它能够同时估计项目参数(如区分度[discrimination]和难度[difficulty/threshold])并检验这些参数是否受到外部协变量(如种族、PTSD诊断)的影响,从而在计算个体在潜在特质(即“真实”正念水平)上的得分时,对存在的测量偏差进行统计校正。为了凸显差异,研究者将MNLFA模型的结果与传统的总分模拟(Total Score Analog, TSA)模型进行了比较,后者在概念上类似于通常使用的求和得分方法。
研究的关键技术方法包括:使用Mplus软件,采用均值方差调整加权最小二乘法(WLSMV)进行模型拟合优度初步检验,评估FFMQ各因子的单维模型;随后系统性地构建MNLFA模型,逐步筛选对项目参数(阈值和载荷)有显著影响的预测变量(即MNI/DIF来源),最终保留显著变量构建全局MNLFA模型用于估计校正后的因子得分;同时建立TSA模型作为对比;模型拟合指标主要参考比较拟合指数(CFI)和近似误差均方根(RMSEA)。
研究结果
样本特征与模型初步拟合
样本平均年龄为32.2岁(SD=8.87),大部分参与者为西班牙裔(57.6%),26.5%被诊断为PTSD。对FFMQ五个因子分别进行的初步验证性因子分析显示,观察(Observing)因子模型拟合良好(CFI=1.00, RMSEA=.000),但描述(Describing)、有意识地行动(Acting with Awareness)、不评判(Non-Judging)和不反应(Non-Reactivity)因子的RMSEA值均高于可接受的阈值(例如,描述因子RMSEA=.24),提示当前样本(主要为接受SUD治疗的西班牙裔女性)的因子结构与最初在大多为非西班牙裔白人普通人群中验证的结构可能存在配置上的差异。
测量非不变性/项目功能差异(MNI/DIF)的识别
MNLFA分析揭示了广泛的MNI/DIF现象。近一半的FFMQ项目至少在一种预测变量上表现出显著的DIF。
在项目阈值/难度(Threshold/Difficulty)参数方面,PTSD诊断、西班牙裔身份和其他种族/身份是导致显著DIF的关键预测因子。例如,对于PTSD患者,某些项目的应答阈值发生了显著偏移(平均效应量d=0.55),意味着达到相同 endorsement 概率所需的潜在特质水平与平均水平不同。西班牙裔参与者在多个项目上也显示出独特的阈值模式(平均d=0.73)。
在项目载荷/区分度(Loading/Discrimination)参数方面,年龄和非西班牙裔黑人身份是主要影响因素。年长参与者在有意识地行动和不反应维度的特定项目上表现出高于平均的区分度。非西班牙裔黑人参与者则在不反应维度的某个项目上显示出更高的区分度。
MNLFA与TSA模型在预测潜在正念因子上的比较
在控制了MNI/DIF之后,MNLFA模型显示,PTSD诊断与较高的有意识地行动(Acting with Awareness)因子得分显著相关(d=0.31)。这表明,患有PTSD的个体在该正念维度上报告了更高的水平,这可能与创伤相关的过度警觉(hypervigilance)有关。西班牙裔身份则与较低的描述(Describing, d=-0.50)和观察(Observing, d=-0.60)因子得分显著相关。
相比之下,TSA模型未能检测到PTSD诊断在有意识地行动因子上的显著差异(p=0.056)。更重要的是,虽然TSA模型也发现了西班牙裔参与者在描述和观察因子上的得分较低,但其估计的效应量(描述d=-0.44,观察d=-0.47)相较于MNLFA模型的估计(描述d=-0.50,观察d=-0.60)有所减小。这意味着,如果使用传统的总分方法,会低估西班牙裔参与者在这些正念维度上与参照组(非西班牙裔白人)的真实差异。此外,TSA模型还错误地检测到年长参与者在有意识地行动因子上存在显著差异,而MNLFA模型则未发现此效应。
讨论与结论
本研究清晰地表明,在评估正念,特别是跨不同种族/民族群体和临床人群(如PTSD患者)时,普遍使用的总分方法存在严重局限性,会导致对群体差异的估计偏差。研究结果强调,PTSD症状和西班牙裔文化背景显著影响了个体对FFMQ项目的反应模式,即存在明显的测量非不变性。
研究结论指出,未能校正MNI/DIF会直接影响对正念干预效果的推断和效应大小的估计,从而在刻画正念特征时产生偏见,特别是对于西班牙裔个体和PTSD患者。例如,TSA模型漏检了PTSD患者在有意识地行动维度上的差异,而可能高估了西班牙裔参与者在描述和观察维度上的差异。这些发现对于正念干预研究具有重要启示:首先,它呼吁在评估MBIs时,尤其是在涉及多样化人群时,需要采用像MNLFA这样更精细的心理测量学方法来校正测量偏差,确保结果的准确性和公平性。其次,它提示我们需要重新审视FFMQ等测量工具在不同文化背景和临床人群中的因子结构和测量等价性,未来研究应致力于开发或验证更具文化适应性的正念评估工具。最后,精确的测量是确保筛查、个体结局监测和整体治疗效果评估公平有效的基石,对于推动成瘾科学及其他健康领域的精准干预和健康公平至关重要。
总之,这项研究通过先进的统计方法揭示了传统正念评估中的潜在陷阱,为提升未来正念相关研究的科学严谨性和跨文化适用性提供了重要的方法论借鉴和实践指导。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号