基于潜在类别和总分的新型计算机自适应测试方法(LSCAT)在生活质量筛查中的应用验证研究

【字体: 时间:2025年07月27日 来源:Quality of Life Research 3.3

编辑推荐:

  本研究针对健康相关生活质量(HR-QoL)筛查中传统问卷耗时且预测效度不足的问题,开发了基于潜在类别和总分的计算机自适应测试(LSCAT)。通过与随机截断法(SC)和决策树法(DTCAT)对比PHQ-9抑郁筛查数据,证明LSCAT在保持高效性的同时显著降低I/II型错误率(Type I/II error rates),为临床快速筛查提供了新工具。

  

在心理健康评估领域,传统问卷如患者健康问卷(PHQ-9)虽被广泛使用,但其固定长度设计面临两难困境:完整版耗时增加受访者负担,而缩短版可能牺牲预测准确性。尤其当需要快速筛查抑郁症状以决定是否进行临床干预时,现有计算机自适应测试(CAT)方法如基于IRT的CAT(IRTCAT)因依赖严格的统计假设和测量目标,难以兼顾效率与预测效度。随机截断法(SC)虽能减少40%的题目量,但固定题目顺序可能错过关键信息;决策树法(DTCAT)则因路径有限导致适应性不足。

阿姆斯特丹大学儿童发展与教育研究所的研究团队提出创新解决方案——潜在类别和总分计算机自适应测试(LSCAT)。该方法结合无限制潜在类别模型(ULCM)的灵活性与总分判别的实用性,通过动态题目选择和概率化停止规则,在保证预测准确性的同时显著缩短测试时间。研究团队利用美国国家健康与营养调查(NHANES)中20,685名受访者的PHQ-9数据,通过事后模拟将LSCAT与SC、DTCAT在两种抑郁临界值(≥5分表轻度抑郁,≥10分表中度抑郁)下对比。结果显示,在平均仅需1.8-4.6题的条件下,LSCAT的I型错误率(Type I error rate)最低达0.001,准确率(Accuracy)高达0.998,科恩κ系数(Cohen's κ)达到0.985的"几乎完美"水平。该成果发表于《Quality of Life Research》,为开发高效筛查工具提供了新范式。

关键技术方法包括:1) 使用潜在类别分析(polCA包)校准ULCM模型;2) 通过贝叶斯信息准则确定潜在类别数;3) 基于NHANES代表性样本划分训练集(Nc=10,343)与验证集(Nv=10,342);4) 设置0.95/0.99双水平停止准则(c)控制测试长度;5) 采用交叉验证比较LSCAT与基准方法。

研究结果:
效率对比:在相同平均题目数条件下(表1),LSCAT标准差(SD)显著高于DTCAT,反映其更强的个体化适应能力。例如在c=0.99、临界值≥10时,LSCAT平均仅需3题(SD=1.919),而DTCAT需固定3题(SD=0.296)。

预测效度:如表2所示,LSCAT在所有场景中保持最低I型错误率(0-0.003)。当筛查中度抑郁(≥10分)时,其II型错误率(Type II error rate=0.024)仅为SC(0.050)的一半,κ系数(0.985)远超DTCAT(0.745)。

错误分布:图1显示LSCAT与SC的错误集中在临界值附近,而DTCAT错误分散。当临界值=5、c=0.99时,LSCAT通过动态选择第2-4题(最具信息量)实现92.1%的准确率。

结论与讨论指出,LSCAT成功解决了筛查工具面临的三大矛盾:1) 题目数量与预测效度的平衡;2) 模型灵活性与计算可行性的统一;3) 个体化适应与标准化判别的结合。其优势源于ULCM对多模态分布的适应能力,以及将响应模式概率直接映射到临床决策的算法设计。尽管当前版本受限于15题以上的内存问题,但研究者正开发开源R包以促进临床应用。该方法的推广将优化抑郁筛查流程,尤其适用于基层医疗和大型流行病学调查,未来可扩展至其他HR-QoL量表的快速筛查。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号