超越简单结构的测量不变性量化:通用效应量度量的封闭形式(适用于测量不变性)
《Structural Equation Modeling: A Multidisciplinary Journal》:Quantifying Measurement Non-Invariance Beyond Simple Structure: The Closed Formulas of Universal Effect Size Measures for MI
【字体:
大
中
小
】
时间:2025年10月26日
来源:Structural Equation Modeling: A Multidisciplinary Journal 3.2
在心理学研究中,评估测量不变性(Measurement Invariance, MI)是进行有效心理量表评价的基础。传统的方法通常将MI视为一个二元决策,即要么保持不变,要么存在偏差。然而,这种方法无法对非不变性的实际影响进行推断,因此提出了效应大小(effect size)的概念,尤其是dMACS。尽管这些效应大小已经应用于具有简单结构的模型,但它们的适用性仍然受到限制。本文旨在扩展dMACS及其后续的测量非不变性效应大小到更一般的因子分析模型,使它们能够广泛适用,并提供相应的实现,具有最优的计算复杂度。
测量不变性是心理量表跨群体或跨时间进行有意义比较的前提。这种不变性意味着,从量表中获得的测量值可以被假设为在所有感兴趣群体中是可比的。为了检测测量不变性中的非不变性源和项目偏差,已经开发了多种方法,其中多组确认性因子分析(Multi-group Confirmatory Factor Analysis, MG-CFA)是最为广泛使用的方法之一。MG-CFA允许研究者通过比较不同参数约束下的模型拟合指标,评估不同群体中的不变性水平。然而,这种方法也存在一些不足之处,例如无法处理连续的协变量,以及在处理多个群体时的局限性。此外,MG-CFA仅适用于确认性因子分析模型,无法应对探索性因子分析(Exploratory Factor Analysis, EFA)的新兴方法。
尽管存在一些例外情况,如对测量非不变性(Measurement Non-Invariance, MNE)视为可最小化量的对齐优化方法,但大多数方法仍然将MI测试视为一个二元决策。这种做法的弊端在于,显著性检验和模型拟合指标依赖于样本量,较大的样本量会增加统计功效,从而可能导致显著结果,表明MI被违反。因此,仅关注统计显著性不足以对MNE进行有意义的评估。为了判断检测到的MI违反是否构成严重偏差,或者非不变性的程度是否可以忽略,研究者需要能够量化MI。因此,提出了MI效应大小测量。
大多数量化MNE的方法灵感来自常用的均值差异效应大小测量,如t检验或方差分析(ANOVA)中的均值差异。其中,心理学中最受欢迎的效应大小测量是Cohen’s d,它通过将两个独立群体的均值差异除以合并标准差来标准化均值差异。这种方法被应用于MI领域,由Nye和Drasgow提出,他们通过积分形式量化预测响应的差异,以计算dMACS。然而,对于具有多个因子载荷的项目,需要更复杂的公式来评估,这引出了本文的核心问题:是否存在一种适用于多因子模型的dMACS的自然扩展。
本文的研究重点在于,通过重新表述和使用清晰的符号,为多因子模型提供适用于多因子载荷和因子相关性的扩展。我们展示了所有最新方法(SotA)的扩展形式,使它们在心理测量和统计推断中更具可比性。通过引入一种称为“期望差异测量”(Expected Difference Measures, EDMs)的通用方法,我们解决了计算复杂性的问题,使所有相关效应大小具有线性计算复杂度。
本文的扩展方法不仅适用于多因子模型,还可以用于具有交叉载荷和因子相关性的模型。我们介绍了EDMs的基本形式,并展示了它们在不同模型下的适用性。这些扩展方法包括基于Cohen’s d的dMACS、基于Glass’ Δ的dMACS,以及基于Cohen’s f的fMACS。这些扩展方法的共同点在于,它们都基于模型差异的期望值,通过计算模型差异的期望值来量化非不变性的程度。
在本文中,我们还展示了如何通过解析方法来推导EDMs的闭合公式。这种方法基于两个观察:首先,模型差异在两个群体之间是正态分布的;其次,正态分布变量的基本积分具有精确解。通过应用这些观察,我们能够计算出模型差异的期望值、绝对值和平方值,从而得到闭合公式。这些公式不仅适用于多因子模型,还可以用于具有交叉载荷和因子相关性的模型。
此外,我们还讨论了EDMs在实际研究中的应用。这些效应大小测量可以用于不同的心理量表,如人格特质、动机或智力等多因子模型。在这些模型中,因子之间的相关性或交叉载荷可能影响效应大小的计算,因此需要考虑这些因素。同时,我们也指出了EDMs的一些局限性,例如它们依赖于因子的联合正态分布,如果这一假设不成立,上述公式将不再适用,需要使用数值近似方法。
总的来说,本文提出了一种适用于多因子模型的效应大小测量方法,使研究者能够更准确地评估测量非不变性。这种方法不仅提高了心理量表的可比性,还为后续研究提供了新的方向。未来的研究可以进一步探讨不同旋转方法对EDMs的影响,以及如何在非线性模型中应用这些效应大小测量。此外,还可以探索如何在非正态分布情况下调整EDMs,以确保其在实际研究中的适用性。这些研究将有助于进一步提高心理量表的测量质量,使其在不同群体和不同情境下更具可比性和有效性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号