基于脑电图技术和机器学习的青少年抑郁症辅助诊断与治疗效果预测模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Human Neuroscience》：Building an auxiliary diagnostic and treatment efficacy prediction model for adolescent depression using machine learning based on electroencephalography technology

【字体：大中小】 时间：2026年06月09日 来源：Frontiers in Human Neuroscience 2.7

编辑推荐：

　　背景：青少年抑郁症具有高发病率和显著复发风险，已成为全球重大公共卫生问题。当前诊断主要依赖主观问卷，缺乏客观生物标志物，早期识别面临挑战。尽管运动干预被推荐为安全有效的非药物一线疗法，但个体反应差异显著，约30–40%的患者症状改善有限，需要可靠的神经生物学标

背景：青少年抑郁症具有高发病率和显著复发风险，已成为全球重大公共卫生问题。当前诊断主要依赖主观问卷，缺乏客观生物标志物，早期识别面临挑战。尽管运动干预被推荐为安全有效的非药物一线疗法，但个体反应差异显著，约30–40%的患者症状改善有限，需要可靠的神经生物学标志物预测干预反应并实现精准运动处方。静息态脑电图（resting-state electroencephalography, rs-EEG）因其非侵入性、低成本和高时间分辨率，成为识别抑郁症客观标记物的理想工具。本研究旨在基于rs-EEG的静态和动态功能连接特征，结合机器学习算法，构建高性能的青少年抑郁辅助诊断模型，并进一步寻找能够预测运动干预疗效的神经生理学生物标志物，从而为早期识别和个体化非药物干预提供客观、实用的技术支持。方法：本研究采用了一个结合诊断模型和预测模型的机器学习框架。诊断模型旨在从健康青少年（N=155）和亚临床抑郁青少年（N=149）中识别抑郁个体，而预测模型则关注同一抑郁队列（N=149）对基于虚拟现实的运动干预的情绪反应，将参与者分为高、中、低反应组。收集了六分钟静息态脑电图信号，经过预处理，并使用Schaefer模板分割为78个脑区，然后将这些脑区归入五个核心网络（感觉运动网络、背侧注意网络、突显网络、默认模式网络和中央执行网络）。随后提取了θ、α和β频段上的45个锁相功能连接特征。采用三阶段特征选择方法（随机森林重要性排序、皮尔逊相关冗余去除、穷举搜索确定最优子集）筛选关键神经生物标志物。构建并比较了四种分类模型——逻辑回归、支持向量机、随机森林和XGBoost。采用十折交叉验证和网格搜索优化超参数，以准确率、召回率、精确率、F1分数和AUC-ROC评估性能。最后，应用SHAP框架进行模型可解释性分析，揭示关键脑网络特征的贡献和交互作用。结果：诊断模型：XGBoost模型在区分亚临床抑郁患者与健康对照方面表现出卓越性能（AUC=0.994，准确率=96.7%）。核心生物标志物主要集中在β和α频段的背侧注意网络（dorsal attention network, DAN）、突显网络（salience network, SN）和感觉运动网络（sensorimotor network, SMN）内部连接，其中β频段DAN内连接贡献最大。SHAP交互依赖分析进一步揭示了可能包含复杂非线性交互模式，包括以β-DAN和θ-SMN-DAN为中心的“分叉-碰撞体”协同结构、α-SN对β-DAN的跨频抑制，以及α-SMN-DAN对β-DMN的动态门控。本研究结果表明，亚临床抑郁（subclinical depression, ScD）表现为涉及多个频段和脑网络的协同失调模式。在预测模型方面，支持向量机（support vector machine, SVM）在预测ScD患者对运动干预反应方面表现最佳，基线积极情绪（positive affect, PA）水平和β频段感觉运动网络（sensorimotor network, SMN）与背侧注意网络（dorsal attentional network, DAN）之间的功能连接被确定为关键预测因子。此外，模型揭示的特征交互模式为从多频段、多网络不同步的角度理解亚临床抑郁的底层模型衍生神经生理模式提供了一个可检验的框架；然而，这些结果仍应被解释为统计关联而非生物学因果的直接证据。SHAP分析揭示了一条可解释的整合路径（“行为驱动→核心协调→动态门控→频段平衡”），为行为-神经整合在个性化干预中的作用提供了模型驱动的见解。结论：本研究首次系统阐明了亚临床抑郁在多频段脑网络水平上复杂的模型衍生神经生理模式。证实了脑电图功能连接作为客观生物标志物的巨大潜力，同时为运动干预的精准选择提供了可解释的神经生理学基础。这些发现加深了对抑郁症早期病理生理学的理解，并为开发低成本、非侵入性的早期筛查和个性化治疗决策工具奠定了坚实基础。

本研究聚焦于青少年抑郁症的早期识别与个体化干预，基于脑电图（EEG）技术结合机器学习方法，构建辅助诊断与疗效预测模型。研究背景方面，青少年抑郁症发病率高、复发风险大，且现有诊断依赖主观问卷，缺乏客观生物标志物；运动干预虽被推荐为首选非药物疗法，但个体反应差异大，约30–40%患者改善有限。因此，亟需可靠的神经生物学指标来预测干预效果，实现精准运动处方。研究人员利用静息态EEG（rs-EEG）的功能连接特征，采用机器学习框架（包括诊断模型XGBoost与预测模型支持向量机SVM），并借助SHAP可解释性分析，揭示了多频段、多脑网络的复杂交互模式。主要结论包括：诊断模型（AUC=0.994）有效区分亚临床抑郁（ScD）与健康对照，核心特征集中在β和α频段的背侧注意网络（DAN）、突显网络（SN）和感觉运动网络（SMN）；预测模型（SVM）可区分干预高反应组与中反应组，基线积极情绪（PA）和β频段SMN-DAN连接是关键预测因子。该研究意义在于首次系统阐明亚临床抑郁的多频段脑网络非线性协同失调模式，为低成本的早期筛查和个性化干预提供神经生理学基础。论文发表在《Frontiers in Human Neuroscience》。

研究方法主要关键技术包括：（1）数据采集与预处理：使用32通道EEG系统（Neuroscan）采集6分钟静息态EEG，阻抗<10 kΩ，采样频率1024 Hz；预处理包括滤波（48–52 Hz陷波、1–30 Hz带通）、独立成分分析（ICA）去伪迹，保留>300秒数据。样本队列来自陕西师范大学学术委员会伦理批准的研究，包括亚临床抑郁组（ScD, N=149）和健康对照组（HC, N=155），年龄13–18岁。基于Schaefer-78模板将皮质分为78个脑区，再归入五个核心网络（SMN、DAN、SN、默认模式网络DMN、中央执行网络CEN）。使用锁相值（PLV）在源空间（sLORETA算法）计算θ、α、β频段内及网络间共45个功能连接特征。采用三阶段特征选择（随机森林重要性排序、皮尔逊相关去冗余（|ρ|=0.85）、正向穷举搜索）筛选最优子集。建模使用四种分类器（逻辑回归、SVM、随机森林、XGBoost），10折交叉验证+网格搜索调参。模型可解释性采用SHAP框架（基于独立测试集）。运动干预方案为基于虚拟现实（VR）的中等强度自行车运动（每周3次，每次30分钟，共8周），疗效评估基于积极情绪（PA）改善量，结合临床显著性方法（可靠变化指数RCI和临床截断点）划分为高、中、低反应组。

研究结果具体如下：

**3.1 诊断模型样本基本信息和预测模型样本基本信息**
诊断模型纳入149例ScD和155例HC，两组在性别、惯用手、Tanner发育阶段、父母教育程度方面无显著差异（p>0.05），但ScD组家庭年收入显著较低（p=0.004），CES-D和PHQ-9评分显著更高（p<0.001）。预测模型中，149例ScD完成干预后，高反应组（N=87，58.4%）基线PA显著高于中反应组（N=62，41.6%）（20.11±1.07 vs. 18.79±1.14，p<0.001），干预后PA及改善量也显著更高。低反应组（改善<3分）未出现。

**3.2 诊断模型最优特征子集选择结果**
从45个功能连接特征中，通过三阶段选择最终确定6个最优特征：β频段DAN内连接、β频段SMN-DAN连接、α频段SN内连接、β频段SN-DMN连接、α频段SMN-DAN连接、β频段SMN-SN连接。特征间无明显共线性（|r|<0.85），均保留进入后续建模。

**3.3 诊断模型和预测模型构建结果**
**3.3.1 诊断模型**：比较四种算法，XGBoost表现最优，AUC=0.994，准确率96.7%，F1=0.9671，精确率0.9691，召回率0.9672。混淆矩阵显示其真阳率和真阴率最高，假阴率最低，优于随机森林、SVM和逻辑回归。
**3.3.2 干预模型**：预测运动干预反应（二分类：高反应 vs. 中反应），SVM表现最优，F1=0.8679，准确率0.8667，精确率0.8768，召回率0.8667，AUC=0.880。虽随机森林AUC略高（0.891），但SVM在临床相关指标上更均衡。

**3.4 诊断模型和预测模型的可视化解释**
**3.4.1 诊断模型**：SHAP分析显示β-DAN贡献最大（36.02%），其次为β-SMN-DAN（22.34%）、α-SN（13.40%）等。β-DAN、α-SN与诊断正相关；β-SMN-DAN、β-SN-DMN、α-SMN-DAN负相关。主效应图揭示非线性S形曲线；交互强度图显示β-DAN与β-SMN-DAN交互最强（IS=0.3686），形成“分叉-碰撞体”协同结构。交互依赖图进一步揭示θ-SMN-DAN与β-DAN构成核心驱动轴，α-SN对β-DAN跨频抑制，α-SMN-DAN动态门控β-DMN。
**3.4.2 预测模型**：SHAP显示Base-PA贡献30.81%，β-SMN-DAN贡献29.93%。Base-PA、β-SMN-DAN、α-SMN-DAN、β-DAN与干预疗效正相关；β-SN-DMN、α-SN负相关。交互依赖图揭示“行为驱动→核心协调→动态门控→频段平衡”因果链：Base-PA通过α/β SMN-DAN跨频枢纽注入行为信息，β-DAN与SN-DMN构成核心神经轴动态门控。

**讨论部分总结**：本研究通过数据驱动的机器学习框架探索亚临床抑郁的神经生理机制，并构建客观诊断模型。最优特征子集强调β和α频段的DAN、SN、SMN的关键作用，支持注意力-突显失衡、内省过度、心身交互异常等早期假设。诊断模型XGBoost卓越表现（AUC=0.994）体现了多频段、多脑网络非线性交互的复杂性；预测模型中SVM优于XGBoost，反映诊断与预后任务的不同神经生理模式。SHAP分析发现的“分叉-碰撞体”、跨频抑制、动态门控等模式均为模型层面的相关解释，而非因果证据，需未来纵向、多中心及因果方法验证。本研究还讨论了青少年神经发育窗口期对网络模式的影响以及模板、低密度EEG等局限性。

**研究结论翻译**：总之，本研究通过利用静息态脑电图功能连接特征，结合可解释机器学习框架（SHAP），成功构建了亚临床抑郁（SCD）的客观诊断模型（XGBoost, AUC=0.994）和运动干预疗效预测模型（SVM）。并首次系统揭示了以β频段背侧注意网络（DAN）为核心、θ频段感觉运动-背侧注意网络（SMN-DAN）为协同轴的多频段、多脑网络非线性交互模式。该机制包括分叉-碰撞体协同结构、跨频抑制通路和动态门控模式。这些发现不仅加深了对抑郁症早期神经病理生理学的理解，也验证了脑电图功能连接作为低成本、非侵入性生物标志物的巨大潜力，为实现早期筛查和个性化干预奠定了坚实基础。

联系信箱：

粤ICP备09063491号

热点排行