多维测验中差异项目功能(DIF)的等值方法比较研究

【字体: 时间:2025年07月21日 来源:Applied Measurement in Education

编辑推荐:

  本研究针对多维项目反应理论(MIRT)框架下差异项目功能(DIF)与测验等值的交互关系展开探索。研究人员通过简单结构MIRT模型模拟数据,系统比较了四种等值方法:简单结构MIRT观察分、单维IRT观察分、单维IRT真分及传统等百分位等值。研究发现当存在差异试卷DIF时,等值结果对群体的依赖性显著增强;在低相关(0.5)条件下,多维等值方法最能准确反映DIF与等值的交互作用;而高相关(0.8/0.95)时各方法表现相当。该研究为复杂测量情境下的测验公平性评估提供了重要方法学参考。

  

这项研究如同给多维测验的公平性装上了"显微镜",深入探查了差异项目功能(DIF)与测验等值之间微妙的互动关系。科研团队采用简单结构多维项目反应理论(MIRT)模型生成模拟数据,精心设计了一场等值方法的"比武大会":简单结构MIRT观察分、单维IRT观察分、单维IRT真分和传统等百分位等值四种方法同台竞技。

研究结果揭示了一个关键转折点——当试卷间存在DIF时,等值结果对考生群体的敏感度会像温度计中的水银柱般持续上升,直至突破临界阈值。有趣的是,在维度相关性较低(r=0.5)的"疏远关系"情境下,多维等值方法展现出"明察秋毫"的优势,最能精准捕捉DIF与等值的复杂互动;而当维度相关性升高到0.8甚至0.95的"亲密关系"时,所有方法的表现却变得"难分伯仲"。更令人振奋的是,不同试卷间的群体能力均值差异,竟然对这些等值方法的群体不变性毫无影响,这个发现为测验公平性研究投下了一颗"定心丸"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号