
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多维测验中差异项目功能(DIF)的等值方法比较研究
【字体: 大 中 小 】 时间:2025年07月21日 来源:Applied Measurement in Education
编辑推荐:
本研究针对多维项目反应理论(MIRT)框架下差异项目功能(DIF)与测验等值的交互关系展开探索。研究人员通过简单结构MIRT模型模拟数据,系统比较了四种等值方法:简单结构MIRT观察分、单维IRT观察分、单维IRT真分及传统等百分位等值。研究发现当存在差异试卷DIF时,等值结果对群体的依赖性显著增强;在低相关(0.5)条件下,多维等值方法最能准确反映DIF与等值的交互作用;而高相关(0.8/0.95)时各方法表现相当。该研究为复杂测量情境下的测验公平性评估提供了重要方法学参考。
这项研究如同给多维测验的公平性装上了"显微镜",深入探查了差异项目功能(DIF)与测验等值之间微妙的互动关系。科研团队采用简单结构多维项目反应理论(MIRT)模型生成模拟数据,精心设计了一场等值方法的"比武大会":简单结构MIRT观察分、单维IRT观察分、单维IRT真分和传统等百分位等值四种方法同台竞技。
研究结果揭示了一个关键转折点——当试卷间存在DIF时,等值结果对考生群体的敏感度会像温度计中的水银柱般持续上升,直至突破临界阈值。有趣的是,在维度相关性较低(r=0.5)的"疏远关系"情境下,多维等值方法展现出"明察秋毫"的优势,最能精准捕捉DIF与等值的复杂互动;而当维度相关性升高到0.8甚至0.95的"亲密关系"时,所有方法的表现却变得"难分伯仲"。更令人振奋的是,不同试卷间的群体能力均值差异,竟然对这些等值方法的群体不变性毫无影响,这个发现为测验公平性研究投下了一颗"定心丸"。
生物通微信公众号
知名企业招聘