从PHQ-2到PHQ-2W:基于数据的抑郁情绪和疲劳症状识别,以优化抑郁筛查的权重设置

《Journal of Affective Disorders》:From PHQ-2 to PHQ-2W: Data-driven identification of depressed mood and fatigue for optimized weighted depression screening

【字体: 时间:2026年01月06日 来源:Journal of Affective Disorders 4.9

编辑推荐:

  本研究通过数据驱动方法优化抑郁症筛查工具,利用RFECV筛选PHQ-9核心项目组合,发现项目2(情绪低落)和4(疲劳)组合解释总评分80%变异,并显著提升PHQ-2W的敏感性(17%)和AUC等指标,优于传统PHQ-2。

  
徐若飞|王明远|徐东武|严文静
温州医科大学心理健康学院,中国温州

摘要

目的

本研究旨在通过数据驱动的方法优化抑郁症筛查工具,从PHQ-9量表中识别出最具预测性的核心项目组合,以构建一个新的简化版抑郁症筛查工具。

方法

利用11个国际数据集,我们采用RFECV方法从PHQ-9中选择最具预测性的项目组合。随后开发了逻辑回归模型,并在多个独立数据集上进行外部验证,系统地比较了新开发的PHQ-2W(项目2+4)与传统的PHQ-2(项目1+2)。

结果

数据分析显示,抑郁情绪(项目2)和疲劳(项目4)的组合表现出最强的预测能力,能够解释PHQ-9总分数变化的约80%。当PHQ-9总分数的临界值为≥15时,PHQ-2W模型的AUC为0.9590,敏感性为0.9308,特异性为0.8533;当临界值为≥10时,模型的AUC为0.9545,敏感性为0.8999,特异性为0.8632。外部验证表明,与传统PHQ-2相比,PHQ-2W在多个指标上表现更好,AUC平均提高了1.9–3.0个百分点,准确性提高了3.0个百分点。值得注意的是,当PHQ-9≥10的临界值时,PHQ-2W的敏感性显著提高了17个百分点(0.8714对比0.6980)。

结论

抑郁情绪和疲劳作为抑郁症的核心症状,共同构成了抑郁症的情感-躯体核心网络。通过权重分配和灵活的阈值调整,PHQ-2W结合了效率和适应性,为抑郁症的早期识别和干预提供了新的方法和实践方向。

引言

在抑郁症的诊断框架中,《精神疾病诊断与统计手册》(DSM-5)明确将快感缺失(兴趣或愉悦感的丧失,对应于PHQ-2的第一个项目)和抑郁情绪(对应于PHQ-2的第二个项目)确定为抑郁症的两个核心症状。抑郁情绪反映了患者持续的负面情绪体验,而快感缺失则反映了日常活动中愉悦感的丧失。这种划分基于广泛的临床观察和理论研究,认为这两个症状最能反映抑郁症的本质特征,对于理解和评估抑郁状态至关重要(Hegerl, 2014)。
基于这一理论框架,PHQ-2作为一种包含这两个核心症状的简短抑郁症筛查工具,在临床和公共卫生环境中得到了广泛应用。一项涵盖44,318名参与者的系统回顾和元分析显示,当PHQ-2的临界分数≥3时,其敏感性为76%,特异性为87%,具有较高的诊断准确性(Levis等人,2020)。在墨西哥一个讲西班牙语的农村人群中,PHQ-2的临界分数≥3时,敏感性为80.0%,特异性为86.9%,ROC曲线下面积为0.89(Arrieta等人,2017)。在日本的一家初级保健门诊诊所进行的研究中,PHQ-2的临界分数≥3时,敏感性为76%,特异性为82%,支持其在亚洲人群中的应用(Suzuki等人,2015)。
因此,简化的PHQ-2在各种临床环境中结合了操作的简便性和诊断的准确性,成为当代抑郁症初步筛查的经典工具。
近年来,随着网络分析方法在抑郁症症状研究中的广泛应用,关于PHQ-9的核心症状出现了显著的分歧和不一致性。基于DSM-5的传统理论认为,快感缺失(PHQ-9项目1)和抑郁情绪(PHQ-9项目2)是抑郁症的核心症状。然而,多项网络分析研究表明,PHQ-9中的其他症状在症状网络中往往表现出更强的中心性或更稳健的关联。
Malgaroli等人(2021)进行了一项系统回顾,分析了23项抑郁症网络研究(包括58个横断面网络),发现疲劳和抑郁情绪是最为核心的症状,而体重变化通常表现出最弱的中心性。这项回顾揭示了抑郁症症状网络中的两个主要群体:一个以抑郁情绪为中心的情感症状群(包括抑郁情绪、快感缺失、无价值感和自杀念头),另一个以疲劳为中心的躯体症状群(包括疲劳、注意力问题和心理运动障碍)。这一发现挑战了传统观点,表明抑郁症可能不仅仅由核心情感症状驱动,躯体症状(尤其是疲劳)在抑郁症的发展和维持中也可能起着同样重要的作用(Malgaroli等人,2021)。
其他研究也支持了这种核心症状多样化的现象。例如,一项基于2023年社区样本(平均年龄49.87岁,73.9%为女性)的网络分析研究发现,不同抑郁症症状组合之间的网络结构存在显著差异。值得注意的是,在某些网络中,抑郁情绪和快感缺失并非始终是绝对的核心症状,疲劳(PHQ4)和睡眠问题(PHQ3)表现出更强的中心性(Nú?ez等人,2024)。另一项针对413名糖尿病患者的研究显示,在女性组中,快感缺失(PHQ1)和能量缺乏(PHQ4)之间的联系最为紧密,但大多数核心和桥梁症状与过度担忧和紧张有关,表明焦虑相关症状在网络中占据重要位置,而不仅仅是传统意义上的核心抑郁症状(Wu等人,2024)。此外,在一项针对248名有非自杀性自伤行为的青少年的研究中,内疚感(PHQ6)、快感缺失(PHQ1)和疲劳(PHQ4)被确定为最为核心的抑郁症状,表明虽然快感缺失很重要,但其他症状也起着同样关键的作用(Nú?ez等人,2024)。
这些研究表明,尽管DSM-5理论明确将抑郁情绪和快感缺失确定为核心症状,但其他PHQ-9项目如疲劳、睡眠障碍和内疚感在不同人群、临床环境和共病条件下往往表现出更强的网络中心性和桥梁作用。这种不一致性主要源于抑郁症状的异质性、样本差异以及症状之间的复杂动态相互作用。网络分析强调了症状之间的联系和影响,表明抑郁症的核心症状可能并非固定不变。
基于上述网络分析揭示的症状中心性不一致性,一个关键问题随之出现:鉴于传统定义的核心症状与某些实证数据之间的差异,这是否意味着基于经典PHQ-2的筛查工具在筛查效率和准确性方面存在局限性?是否存在一种基于实证数据驱动的方法,能够识别出更具预测性的简化症状组合,从而构建性能更优的快速筛查方案?
这一研究空白源于对PHQ-9各个项目预测能力的深入分析。例如,一项针对中国青少年的大规模网络分析发现,抑郁情绪(PHQ-9项目2)和疲劳(PHQ-9项目4)的组合在预测整体抑郁症状分数方面优于传统的PHQ1+PHQ2组合,表现出更高的筛查敏感性和特异性(Liang等人,2023)。这表明,仅依赖经典核心症状可能会忽略抑郁症的其他重要表现,从而限制筛查工具效果的提升。此外,一些研究表明,尽管PHQ-2简洁明了,但在某些人群中其敏感性不足,可能导致漏诊的风险。一项使用PHQ-2评估1型糖尿病青少年的研究发现,其测量敏感性相对较低,仅在38%至44%之间(Marker等人,2019)。这进一步强调了优化筛查项目组合的必要性。
因此,当前的关键问题是如何利用数据驱动的方法克服传统理论的局限性,从完整的PHQ-9量表中选择最具预测性的项目组合,确保筛查的简便性和预测准确性的最大化。这种方法不仅有助于提高快速抑郁症筛查的效率,还为抑郁症核心症状的理论重构提供了实证依据,推动了临床筛查工具的创新和优化。
本研究采用了一种数据驱动的研究方法,不依赖于先验的理论假设,而是直接从数据本身出发,旨在从完整的PHQ-9量表中识别出对总分数具有最强预测和解释能力的核心项目组合。研究的主要目标包括两个方面:首先,通过严格的数据分析,确定最能有效预测PHQ-9总分数的两个项目组合,从而验证和深化我们对抑郁症核心症状的理解;其次,基于这一发现,构建一个新的、精简的两项目筛查工具,为临床和研究目的提供更高效的初步抑郁症筛查方案。这种数据驱动的简化方法有望显著提高效率,同时保持筛查的准确性。

部分内容摘录

数据库介绍

研究数据来源于多个国际数据库,包括:美国健康心理研究(HMS)数据库(HMS19–20至HMS23–24),该数据库收集了美国高等教育学生心理健康状况、服务使用情况及相关态度和行为的信息(https://healthymindsnetwork.org/),以及英国学生心理健康数据集(Akram和Stevenson,2024),该数据集收集了焦虑等多维心理指标

数据驱动的RFECV特征选择

RFE交叉验证分析结果(图1)表明,在所有11个数据集中,PHQ-9量表可以有效地压缩为更短的版本,同时保持高预测性能。表2总结了每个PHQ-9项目作为核心特征(无论是单独项目还是两部分组合)在11个数据集中的出现频率。如表1和表2所示,当使用单个特征时,项目2是最常被选中的项目

讨论

本研究采用数据驱动的方法,从PHQ-9量表中识别出最具预测性的核心症状组合。主要发现如下:在对11个独立数据集进行RFE交叉验证分析后,项目2(抑郁情绪)和项目4(疲劳)被确定为预测PHQ-9总分数的最佳两个项目组合。项目2单独解释了PHQ-9总分数变化的约66%,而项目2和项目4的组合解释了约80%的变化

结论

本研究采用数据驱动的方法优化了抑郁症筛查工具,从PHQ-9量表中识别出更具预测效率的核心症状组合——抑郁情绪(项目2)和疲劳(项目4),构建了一个新的简化工具PHQ-2W。与传统PHQ-2相比,PHQ-2W在多个独立数据集中表现出更高的AUC、敏感性和特异性,整体筛查效果显著提升,特别是在降低漏诊风险方面

CRediT作者贡献声明

徐若飞:写作——审稿与编辑,撰写初稿,可视化,方法论,数据管理,概念化。王明远:写作——审稿与编辑,撰写初稿。徐东武:监督。严文静:写作——审稿与编辑,撰写初稿,可视化,监督,方法论,数据管理,概念化。

出版同意

不适用。

伦理批准

由于我们的研究涉及对现有去标识化数据的分析,因此不需要对该研究进行直接的伦理批准。原始数据收集符合相关国家和机构关于人类实验的伦理标准,以及2000年修订的《赫尔辛基宣言》。所有数据均在适当的伦理监督下收集。

临床试验编号

不适用。

写作过程中生成式AI和AI辅助技术的声明

在准备本工作时,作者使用了ChatGPT-4o来提高手稿的可读性和语言表达。使用该工具/服务后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。

资助

本研究得到了浙江省哲学与社会科学规划项目(25YJRC008ZD-1)、浙江省高等教育机构重大人文与社会科学研究项目(2024GH036)以及温州市科学技术计划项目(ZY2023029)的支持。

利益冲突声明

作者声明他们没有已知的利益冲突或个人关系可能影响本文所述的工作。

致谢

不适用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号