机器学习驱动的 CAT 助力心理健康评估,高效又精准

【字体: 时间:2025年02月23日 来源:Scientific Reports 3.8

编辑推荐:

  为解决传统心理健康评估负担重、结果可能不可靠等问题,西班牙研究人员开展基于机器学习 - 模型树的计算机自适应测试(CAT)研究。结果显示其能减少测试题目且准确评估。推荐阅读,助你了解心理健康评估新进展。

  
在心理健康领域,准确评估症状和客观测量患者状况对于临床决策和有效治疗计划至关重要。然而,传统的诊断和筛查过程往往需要患者进行多项测试并频繁接受监测,这不仅给患者带来了沉重的负担,尤其是对于老年人或身体虚弱的患者,还可能导致评估结果不可靠。因为患者可能会因回答大量重复或不恰当的问题而感到厌烦和疲劳,从而给出草率和不准确的答案。此外,冗长的评估工具在研究领域也存在局限性,难以在实际心理健康环境中进行系统的治疗效果研究。

为了解决这些问题,西班牙的研究人员在《Scientific Reports》期刊上发表了题为 “Evaluating the effectiveness of machine learning-model tree-based computerized adaptive testing in detecting changes in mental health measures” 的论文。研究发现,基于机器学习 - 模型树(ML - MT)的计算机自适应测试(CAT)能够在减少一半以上测试题目的情况下,提供与完整版测试相当的特质水平估计,且在检测特质水平和诊断分类随时间的变化方面表现出色,与完整版测试结果有较高的一致性,在抑郁症测量方面比静态简短量表更准确。这一研究为心理健康评估提供了一种高效且准确的新方法,有助于改善临床评估流程,减轻患者和专业人员的负担。

研究人员采用了多种关键技术方法来开展此项研究。首先,他们从公共存储库 OSF 中获取了 564 名西班牙大学生的数据,这些数据来自一项为期 18 个月的纵向研究,涵盖了心理健康、人格特质和风险因素等方面,且在 2018 年 2 月至 2019 年 12 月期间分四个阶段收集。其次,研究中使用了三种心理健康测量工具,包括用于评估广泛性焦虑和社交焦虑的西班牙版 DSM - 5 焦虑严重度量表(GAD - D 和 SAD - D),以及用于测量抑郁症的患者健康问卷 - 9(PHQ - 9)。最后,为了评估基于 ML - MT 的 CAT 检测心理健康变化的能力,研究人员使用了基于真实数据模拟的交叉验证方法,针对每个量表创建训练数据集和测试数据集,并运用 Weka 3.8.5 软件中的 M5P 算法进行分析。

下面我们来详细看看具体的研究结果:

  1. 参与者:数据来自 564 名西班牙大学生,他们参与了 18 个月的纵向研究,在四个时间点(T1、T2、T3、T4)进行了心理健康评估。参与者在每次评估时都获得了经济补偿,并且所有参与者在研究前均提供了知情同意,研究也得到了相关伦理委员会的批准。
  2. 测量工具
    • 广泛性焦虑(GAD - D):使用西班牙版的广泛性焦虑障碍维度量表(GAD - D),该量表有 10 个项目,采用 5 分制评分。得分越高,焦虑程度越严重。其在西班牙语境下具有良好的信度和效度,推荐的临界值为≥13。
    • 抑郁症(PHQ - 9):采用患者健康问卷 - 9(PHQ - 9)测量抑郁症,有 9 个项目,采用 4 分制评分。该版本聚焦过去 6 个月的情况,得分越高表示抑郁程度越严重,通常建议的临界值为≥10。
    • 社交焦虑(SAD - D):通过西班牙版的社交焦虑障碍维度量表(SAD - D)评估社交焦虑,同样有 10 个项目,5 分制评分,得分越高焦虑越严重,临界值为≥14。

  3. 分析结果
    • 广泛性焦虑(GAD - D):M5P 算法对 GAD - D 量表训练数据的分析生成了一个树结构,根节点为项目 2。在测试数据集上模拟 CAT 程序的结果显示,该程序平均仅需 4.49(T1)和 4.39(T4)个项目就能完成评估,节省了超过 50% 的题目。CAT 得分与完整版测试得分的相关性在 T1 和 T4 分别达到 0.89 和 0.88,MAE 分别为 1.62 和 1.56,t 检验表明二者得分无显著差异。在检测 GAD - D 得分变化方面,两种测试方法的一致性达到 79.9%,在分类变化检测上一致性为 87.6%。
    • 抑郁症(PHQ - 9):M5P 算法对 PHQ - 9 量表训练数据的处理产生了 26 个叶子的树结构,根节点为项目 4。CAT 程序在 T1 和 T4 平均分别使用 4.46 和 4.39 个项目进行评估,节省约 50% 题目。其与完整版测试得分的相关性在 T1 和 T4 分别为 0.88 和 0.91,MAE 分别为 1.34 和 1.16,t 检验显示二者得分无显著差异。在检测得分变化时,两种测试方法一致性为 75.4%,分类变化检测的一致性为 87.7%。与 PHQ - 2 相比,CAT 在检测变化方面表现更优。
    • 社交焦虑(SAD - D):对 SAD - D 量表训练数据运用 M5P 算法生成了 26 个叶子的树结构,根节点为项目 1。CAT 程序在 T1 - T4 平均使用 4.59 - 4.35 个项目完成评估,节省超过 50% 题目。其与完整版测试得分的相关性在 T1 - T4 分别为 0.90 - 0.94,在多数时间点二者得分无显著差异。在检测得分变化和分类变化方面,两种测试方法的一致性分别为 88.19% 和 93.7%。


总的来说,这项研究表明基于 ML - MT 的 CAT 在心理健康评估方面表现出色,能够大幅减少测试题目数量,同时保证评估的准确性,在检测特质水平和诊断分类的变化上与完整版测试有较高的一致性,并且在抑郁症评估上比静态简短量表更具优势。这一研究成果对于心理健康领域意义重大,它为临床实践提供了一种更高效的评估工具,能够减轻患者和专业人员的负担,促进更全面的心理健康筛查和频繁监测。同时,为研究人员在现实环境中监测治疗效果提供了更便捷的方法,有助于提高研究的严谨性。不过,研究也存在一些局限性,如样本量可以进一步扩大,未来研究可考虑纳入更多外部变量,还需在更大范围和不同样本中进行验证。但无论如何,该研究为心理健康评估开辟了新的道路,基于 ML - MT 的 CAT 有望成为传统评估方法的有力替代方案,推动心理健康领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号