
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:基于脑电图机器学习的强迫症分类系统综述:现状与未来方向
【字体: 大 中 小 】 时间:2025年09月10日 来源:BMC Psychiatry 3.6
编辑推荐:
本综述系统评估了EEG(脑电图)与ML(机器学习)在OCD(强迫症)分类中的应用现状,指出当前研究存在方法异质性高、样本量小、缺乏模型可解释性(如SHAP/LIME)等局限,强调需建立标准化流程(如COBIDAS-MEEG)以推动临床转化(如神经反馈/tES靶向治疗)。
引言
强迫症(Obsessive-Compulsive Disorder, OCD)是一种慢性致残性精神疾病,全球患病率约3.5%,女性(5.4%)高于男性(1.7%)。约60%患者症状持续终身,50%在18岁前发病,70%在20岁前出现症状。OCD显著降低患者生活质量与社会功能,且诊断平均延迟7.1年,原因包括病耻感、医疗资源有限及症状与其他精神障碍重叠导致的误诊。脑电图(Electroencephalography, EEG)因其毫秒级时间分辨率、低成本及便携性,成为探索OCD生物标志物的重要工具。结合机器学习(Machine Learning, ML)技术,EEG为OCD的精准分类与个体化治疗提供了新途径。
方法
本研究遵循PRISMA指南,系统检索Web of Science、Scopus、PubMed和IEEE数据库截至2025年2月的文献。初检67篇文献,去重后筛选42篇,最终纳入11篇符合标准的研究。数据提取涵盖四个维度:研究基本信息、人群特征、EEG特征和机器学习特征。因研究间存在显著异质性(如样本量、预处理方法、模型设计),未进行定量荟萃分析,仅开展定性合成。
当前研究现状
地理分布与泛化挑战
11项研究中10项来自亚洲国家(如土耳其、印度、中国),仅1项为欧洲-亚洲合作。这种地域集中性限制了结论对非亚洲人群的泛化性。36%研究使用公开数据集,54%为原始数据,9%混合二者。公开数据集虽促进可重复性,但常缺乏关键临床与人口学信息(如年龄、性别、用药史),可能引入偏差。
OCD定义与亚型忽略
54%研究未报告OCD诊断标准(如DSM-5/ICD-10),仅18%由精神科医生确诊。所有研究均未分析OCD亚型(如污染型、对称型),而fMRI研究已证实不同亚型存在脑激活模式差异。仅1项研究按焦虑水平分组(非DSM亚型),样本量小(如Mukherjee等仅46例OCD)且报告准确率虚高(达100%),而大样本研究(如Farhad等86例)准确率更稳健(75-90%)。
EEG技术参数异质性
电极导联:8项研究采用10-20系统,2项用10-10系统,54%未报告参考电极位置。
频段分析:54%研究聚焦经典频段(δ、θ、α、β),27%扩展至高β和γ频段,2项使用原始信号,2项未指定频段。
实验条件:81%研究使用静息态EEG,其中7项为闭眼状态(易引发α波干扰)。
预处理:45%研究应用带通滤波,27%使用独立成分分析(ICA),但方法缺乏一致性(如滤波范围、去噪技术)。
机器学习模型与性能
传统模型仍占主导:SVM(5项)、随机森林(RF)、C5.0和XGBoost(共5项)。深度学习模型使用率上升(2023-2025),以LSTM及其变体(如Bi-LSTM、CNN-LSTM)为主(占深度学习模型的30.8%),因其擅长处理时序数据且对小样本更稳健。
准确率报告差异显著:内部验证(如交叉验证)准确率较高(如1DCNN-LSTM达90.88%),但外部验证普遍下降(如降至75%)。深度模型总体优于传统模型,但需警惕过拟合(尤其小样本研究)。
可解释性缺失
无一研究使用SHAP或LIME等现代可解释技术,仅3项尝试用统计检验解读特征重要性,限制了模型决策透明性与临床应用(如神经反馈电极定位或tES靶向治疗)。
偏倚风险
基于改良QUADAS-2评估,最高偏倚风险存在于患者选择域(如未排除共病或用药影响),最低在流程时序域。随机数据拆分仅5项研究明确报告,高准确率研究(如Mukherjee等)常伴随高偏倚风险。
未来方向:标准化框架与临床转化
三层标准化框架(图6)
数据预处理标准化:采用COBIDAS-MEEG流程,包括坏道剔除、ICA去伪迹、滤波、分段、基线校正、参考电极转换及频谱分析。
准确率报告规范:遵循TRIPOD指南,公开代码与完整参数,鼓励开发TRIPOD-EEG扩展标准。
模型可解释性整合:嵌入SHAP/LIME解析关键电极与频段(如γ和高β频段),指导个体化治疗。
临床转化挑战
监管准备:需满足FDA可重复性标准,建立多中心共享EEG数据库(类似Human Connectome Project)。
共病管理:开发EEG-fMRI融合生物标志物区分OCD与抑郁/ADHD等共病。
技术验证:通过便携式EEG设备开展真实世界研究,验证模型泛化性。
局限性与展望
当前研究样本量小、异质性高、缺乏亚型分析与外部验证,结论需谨慎解读。未来需聚焦:
纳入临床变量(如症状维度、治疗反应、人口学特征);
结合高级信号处理(如功率谱密度、功能连接);
探索无监督学习与维度缩减(如t-SNE、自编码器)揭示深层模式。
结论
EEG-ML在OCD分类中展现潜力,但研究异质性限制了临床适用性。通过标准化流程、可解释模型及多维度临床整合,有望推动其向神经反馈、tES治疗等精准医学应用转化。
生物通微信公众号
知名企业招聘