探索性深度认知诊断模型:基于深度生成建模的多层潜在属性分析新方法

《Psychometrika》:Deep Generative Modeling for Cognitive Diagnosis via Exploratory DeepCDMs

【字体: 时间:2025年12月18日 来源:Psychometrika 3.1

编辑推荐:

  本文推荐一项针对认知诊断建模的创新研究。为解决传统认知诊断模型在探索性场景下难以估计多层潜在结构和未知Q矩阵的难题,研究人员开展了探索性深度认知诊断模型(DeepCDMs)研究。提出了一种新颖的层期望最大化算法,结合层谱初始化和L1惩罚项促进稀疏性。结果表明,该方法能有效估计多层潜在属性和Q矩阵,在TIMSS 2019数据应用中展现出良好性能,为教育测量提供了新的分析工具。

  
在教育与心理测量领域,认知诊断模型(Cognitive Diagnosis Models, CDMs)已成为评估学生多维技能掌握状况的重要工具。传统的CDMs通常假设存在单层潜在属性结构,但实际认知过程往往呈现多层次、层级化的特点。近年来,虽然出现了引入高阶连续潜变量来刻画属性间相关性的方法,但这些单层高阶模型在捕捉更深层次认知结构方面仍存在局限。
正是在这样的背景下,Gu(2024)开创性地提出了深度认知诊断模型(Deep Cognitive Diagnostic Models, DeepCDMs),通过构建包含多个离散潜在层的深层架构来刻画认知过程的层次结构。然而,该研究主要关注验证性设置,即各层间的Q矩阵已知的情况。在实际应用中,我们常常面临更复杂的探索性场景,不仅潜在属性的层次结构未知,连接各层属性的Q矩阵也完全需要从数据中估计。这正是本文要解决的核心问题。
图1展示了这种三层DeepCDM的基本架构,其中灰色节点代表观察到的反应变量,白色节点表示各层潜在属性。这种深层结构虽然具有更强的表达能力,但也带来了巨大的估计挑战:当所有Q矩阵未知时,参数空间变得极其复杂,传统的估计方法如马尔可夫链蒙特卡洛(MCMC)面临初始化敏感、收敛慢、混合困难等问题;而经典期望最大化(EM)算法则存在对初始值极度敏感以及误差在层间循环累积的缺陷。
针对这些挑战,本研究提出了一种创新的层EM算法,专门用于探索性DeepCDMs的正则化最大似然估计。该算法的核心思想是利用模型的生成式结构,自底向上逐层估计参数。从方法论角度看,这种层式估计策略与深度生成模型中广泛使用的模块化训练原则一脉相承,但针对诊断建模的结构化和可解释性需求进行了独特设计。
关键技术方法
研究人员开发了层EM算法,核心是逐层估计策略:首先对最底层(d=1)使用单层EM算法估计参数,然后利用估计的潜在属性分布生成伪样本,作为下一层的输入,依次向上处理直至最深层层。算法结合了通用奇异值阈值化(USVT)初始化方法,通过截断SVD去噪和Varimax旋转促进稀疏性。在M步中,采用坐标下降算法求解带L1惩罚的优化问题,有效估计Q矩阵和参数。
研究结果
探索性DeepCDMs框架
研究团队将Gu(2024)提出的验证性DeepCDMs扩展到更具挑战性的探索性场景,所有Q矩阵均未知。探索性DeepCDMs可视为深度生成模型(DGMs)向诊断目的适应的结果,但相比经典DGMs,具有可识别性、可解释性、简约性和稀疏性等关键优势,这些都是诊断建模必不可少的特性。
DeepCDMs采用有向无环图(DAG)表示,定义从高层潜变量到观察反应的生成过程。模型包含D个潜在层,第d个潜在层记为A(d)= (A1(d), ..., AKd(d)),其中更大的d对应更深层。最底层由J个项目的观察反应变量组成,记为R = (R1, ..., RJ)。
具体DeepCDMs示例
研究提出了多种DeepCDMs变体:主效应DeepCDMs(每层条件分布遵循主效应诊断模型)、全效应DeepCDMs(包含所有交互效应)、DeepDINA(仅保留最高阶交互项)以及混合DeepCDMs(允许不同诊断模型跨层应用)。这种灵活性使DeepCDMs能在模型复杂度和简约性间取得平衡,基于特定需求设计诊断模型。
可识别性理论
研究强调了DeepCDMs的形式化可识别性保证,这些保证适用于验证性和探索性设置。可识别性条件对层间Q矩阵施加明确的结构约束,通常要求更深层的潜在变量数量减少(K1> K2> ... > KD),反映了DeepCDMs中的统计简约性原则。可识别性可以自底向上逐层建立,这得益于有向图模型和潜在属性离散性的 formulation。
层EM算法
提出的层EM算法采用逐层估计策略:对于每层d>1,从估计的边际分布P(A(d-1))中抽取样本作为下一层的输入;对每层应用单层EM算法估计参数β(d)、Q(d)和π(d)。算法包含USVT-based初始化程序,通过截断SVD、线性化和Varimax旋转获得可靠的初始值。
模拟研究
研究进行了广泛的模拟研究,评估层EM算法在三种测量模型(主效应、全效应和DINA)下的性能。结果表明,随着样本量增加,所有层的参数估计精度均提高,Q矩阵恢复比例也改善。尽管深层估计更具挑战性,但算法在所有情况下都表现出良好性能,为模型的可识别性提供了实证支持。
实际数据应用
将探索性DeepCDMs应用于TIMSS 2019数据,使用两层DeepCDMs分析1595名八年级学生的反应数据。模型成功恢复了与测试设计密切对应的层次结构:第一层属性自然分为数学和科学两个领域,第二层清晰显示了两个元属性(数学和科学领域)的加载模式。与验证性方法相比,探索性DeepCDMs的BIC(89656)显著低于验证性模型(94946),说明探索性建模能够揭示原始测试设计未完全捕捉的项目-属性关系。
研究结论与意义
本研究通过将DeepCDMs扩展到探索性场景,并开发专门的层EM估计算法,为认知诊断建模提供了强大的新工具。方法学上的创新体现在:一是建立了可识别性理论,为参数估计提供了理论保证;二是提出了高效的层式估计算法,解决了深层结构估计的难题;三是通过正则化方法同步估计Q矩阵和模型参数。
从实践角度看,探索性DeepCDMs不仅能验证现有测试设计的合理性,还能发现潜在的认知结构,为教育和心理测量提供更丰富的诊断信息。TIMSS 2019的应用案例表明,即使在没有完整项目内容信息的情况下,通过分析项目元数据也能对提取的属性进行有意义的解释,这在许多实际应用场景中具有重要价值。
研究的局限性和发展方向包括:需要进一步研究自动确定层数的方法,扩展模型处理多值反应和属性的能力,以及开发更高效的计算算法。将连续潜变量引入更深层次以表示更广泛的认知能力,也是一个有前景的扩展方向。
总之,这项工作在深度生成建模与认知诊断之间架起了概念和方法论的桥梁,为理解和评估层次化认知过程提供了新的视角和工具。随着教育评估对精细化诊断需求日益增长,DeepCDMs框架有望在个性化学习和精准教育干预中发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号