多维项目反应理论参数的广义定义:纳入潜在协方差结构与负向计分项的新框架
《Psychometrika》:A Generalized Definition of Multidimensional Item Response Theory Parameters
【字体:
大
中
小
】
时间:2025年11月20日
来源:Psychometrika 3.1
编辑推荐:
为解决传统多维项目反应理论(MIRT)参数定义在非正交潜在空间和负向计分项应用中的局限性,研究人员开展了对多维2参数逻辑(M2PL)模型中MDISC和MIL参数的广义化研究。通过Reckase最大区分点方法和线性代数重构,提出了包含潜在协方差结构(Σ-based)和仅含相关结构(R-based)的三种参数版本,并明确了项目应在独立于潜在空间的"测试空间"中进行几何表征。该研究为复杂多维测验的精确解释提供了理论支撑,对心理测量学理论与实践具有重要意义。
在心理与教育测量领域,准确评估个体的潜在特质一直是研究者追求的目标。传统的一维项目反应理论(Item Response Theory, IRT)虽已成熟,但现实中的心理构念往往具有多维性。比如,解决一个数学问题可能同时需要计算能力和逻辑推理能力,而一个人的责任心可能体现在工作和生活多个方面。为了更真实地反映这种复杂性,多维项目反应理论(Multidimensional Item Response Theory, MIRT)应运而生,其中多维2参数逻辑模型(Multidimensional 2-Parameter Logistic model, M2PL)因其与常见因子模型的紧密联系和数学上的可处理性,成为应用最广泛的模型之一。
然而,经典的MIRT参数定义存在两大"盲区"。首先,由Reckase等人在1980-90年代提出的多维项目区分度(MDISC)和项目难度(MID)参数,其推导过程隐含了一个关键假设:潜在特质维度之间是相互正交(不相关)的。这好比在一个地图上,我们默认东西方向和南北方向是完全垂直的。但现实中,人的各种心理特质(如语言能力和阅读能力)往往是相关的,将相关特质强行放在正交坐标系中表示,会导致对项目测量特性的误解。其次,传统定义通常要求项目区分度参数为非负值,这与非认知领域广泛使用的负向计分项(如"我常常拖延任务"这类反向表述题目)产生了矛盾。
Daniel Morillo-Cuadrado和Mario Luzardo-Verde敏锐地捕捉到了这些理论缺口。他们思考:如果两个潜在特质高度相关,一个同时测量这两个特质的项目,其真正的区分能力是否会比在正交假设下计算出的值更高?当一个项目在某些特质上是正向区分,在另一些特质上是负向区分时,又该如何准确描述它的测量特性?为了解决这些问题,他们在《Psychometrika》上发表了这项开创性研究。
研究人员主要运用了Reckase的最大区分点方法、线性代数中的基变换理论以及几何表征技术。通过引入任意代数基的概念,他们将M2PL模型重新表述在非正交坐标系中,并严格区分了"潜在空间"(表征被试特质)和"测试空间"(表征项目特性)这两个不同的向量空间。研究还使用了来自认知测验和非认知领域(电子商务网站质量评估)的实际数据作为示例,验证了新参数的实用性。
研究团队首先对M2PL模型进行了广义化表述。概率函数P(Xi=1|ai, di, θ) = 1/(1+exp[-(aiTθ+di)])中的判别参数向量ai被允许包含负值,以容纳负向计分项。通过引入非正交基B={b1,...,bn}和其Gram矩阵M(包含基向量内积),他们建立了从潜在空间到标准正交空间的变换关系。
关键创新在于明确区分了潜在空间Θ和测试空间A。研究发现,只有当两个空间的基都正交时,它们才能被混淆使用;在一般情况下,项目参数应表征在测试空间中,其内积由M-1定义,而潜在特质向量的范数则由Mahalanobis距离给出。这种区分解决了长期以来的概念混淆。
通过Reckase的极值点方法,研究者推导出了三种不同的多维参数定义:
- 1.agnostic版本:对应传统定义,MDISCag = √(aiTai),隐含假设潜在空间正交。当缺乏潜在结构信息时适用。
- 2.协方差结构版本(Σ-based):将几何表示与统计结构结合,MDISCΣ = √(aiTΣ-1ai),其中Σ为潜在特质的协方差矩阵。此版本虽不满足尺度不变性(MDISC值受维度方差影响),但具有基不变性,且与Mahalanobis距离概念一致,推荐用于参数特性描述。
- 3.相关结构版本(R-based):MDISCR = √(aiTRai),其中R为相关矩阵。该版本保持尺度不变性,但牺牲了部分几何一致性,特别适用于图形化表征。
所有版本均满足Reckase & McKinley提出的三个基本性质(单维简化性、距离-难度关系、斜率四倍关系),确保了作为IRT参数合理推广的合法性。
研究提出了在测试空间中正确表示项目向量的方法。项目向量以多维项目位置(MIL)参数确定的方向和距离为起点,长度等于MDISC参数。通过坐标变换公式(如oiB = DiM(D')1/2cosαiB),可将项目坐标转换到标准正交基中进行可视化。
图示案例清晰展示了不同相关结构下参数的变化:当潜在特质正相关时,同向判别参数的项目MDISC值增大,而异向参数的项目MDISC值减小。相关结构版本的表征能更准确地反映项目与潜在特质分布的相对位置。
将新框架应用于Reckase(2009)的经典认知测验数据和Tezza等人(2018)的电子商务质量评估数据,揭示了传统agnostic参数的局限性。在认知测验示例中,当三个潜在维度存在特定相关结构时(如维度1与3高度相关),Σ-based参数显示项目的方向角发生显著变化,更真实地反映了维度间的统计依赖关系。在非认知示例中,包含正负判别参数的项目在新框架下得到了更合理的解释,其测量方向由判别参数的符号决定,而项目位置受截距参数di的符号和大小共同影响。
这项研究的重要贡献在于严格区分了潜在空间与测试空间的概念。 counterintuitive 的是,测试空间基轴间的夹角余弦才对应于特质间的相关系数,而非传统认为的潜在空间基轴夹角。这一发现澄清了MIRT文献中长期存在的误解。
对于多组MIRT应用,新框架意义重大:即使模型参数跨组不变,不同的潜在协方差结构也会导致多维参数差异,反之亦然。这为测验等值、项目功能差异(DIF)分析等应用提供了更精确的理论基础。
研究者推荐在一般性描述中使用协方差结构版本参数,因其具有基不变性等理想性质;而在图形化表征时,可选用相关结构版本以保持尺度直观性。
总之,这项研究通过严谨的数学推导和清晰的几何阐释,解决了MIRT理论中长期存在的两个关键问题,为处理非正交潜在结构和负向计分项提供了统一框架。它不仅深化了对MIRT参数本质的理解,也为未来在复杂测量情境下的应用奠定了坚实基础,标志着心理测量学理论向更成熟的方向迈进了一步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号