编辑推荐:
随着痴呆发病率在全球范围内因生活方式等因素急剧上升,及时诊断变得至关重要。研究人员开展基于脑电图(EEG)信号的痴呆诊断研究,对比传统机器学习与深度学习模型。结果显示深度学习模型(1D、2D CNNs)表现更优,但 Dataset 3 存在挑战。该研究为痴呆早期诊断提供新方向。
在当今社会,生活方式的巨大改变、无处不在的压力以及复杂的环境因素,如同隐藏在暗处的 “杀手”,悄然推动着全球痴呆发病率急剧攀升。据统计,全球已有超过 5500 万人深受痴呆的困扰,每年新增病例近 1000 万,预计到 2030 年这一数字将达到 7800 万,2050 年更是可能飙升至 13900 万 。其中,阿尔茨海默病(AD)最为常见,占所有痴呆病例的 60 - 70%。痴呆不仅严重影响患者的认知能力、日常生活技能,还成为全球老年人致残和依赖他人生活的重要原因之一,因此,及时且准确地诊断痴呆迫在眉睫。
脑电图(EEG)作为一种非侵入性的检测手段,能够记录大脑的电活动,在痴呆早期诊断方面展现出巨大潜力。为了探索如何更好地利用 EEG 信号进行痴呆诊断,来自印度 M. S. Ramaiah 应用科学大学、阿联酋海湾医学大学、印度马尼帕尔高等教育学院、韩国岭南大学的研究人员展开了深入研究,相关成果发表在《Scientific Reports》上。
研究人员采用了多种关键技术方法来开展此项研究。在数据处理方面,针对不同数据集,先进行预处理,如运用带通滤波去除低频漂移和高频噪声,通过独立成分分析(ICA)去除眼动、肌肉活动等伪迹;对于采样频率不同的数据,使用线性插值法进行上采样处理。在模型构建方面,分别构建传统机器学习模型和深度学习模型。传统模型从功率谱密度(PSD)提取特征,利用随机森林(RF)分类器进行分类;深度学习模型则包括 1D 卷积神经网络(1D CNN)直接处理预处理后的 EEG 信号,以及 2D 卷积神经网络(2D CNN)对分解后的 EEG 信号生成的堆叠频谱图进行分类 。研究使用了三个不同的基准数据集,这些数据集涵盖了认知正常(CN)、额颞叶痴呆(FTD)、轻度认知障碍(MCI)和阿尔茨海默病(AD)等不同类别。
研究结果
- Case study A:基于传统机器学习模型的诊断
通过 Welch 方法估计 PSD,从特定频率带(Delta:0.5 - 4Hz、Theta:4 - 8Hz、Alpha:8 - 13Hz、Beta:13 - 25Hz、Gamma:25 - 45Hz)提取统计特征(均值、中位数、标准差)。不同数据集在各频率带表现出不同特征,如 Dataset A 中,AD、FTD 和 CN 在低频范围(0 - 50Hz)功率较高;Dataset B 中,从正常到 MCI 再到 AD,PSD 呈现出认知能力下降的明显趋势;Dataset C 中,MCI 患者在低频段功率更高且更不稳定 。训练后的 RF 模型在不同数据集上表现各异,Dataset A 准确率为 83.88 - 84.77%,Dataset B 准确率为 90.15%,Dataset C 准确率为 77.3 - 77.6% 。SHAP 分析表明,不同数据集的关键特征不同,Dataset A 中 Delta 均值和 Theta 均值最为重要,Dataset B 中 Alpha 均值和 Alpha 中位数较为突出 。
- Case study B:基于 1D CNN 模型的诊断
将预处理后的 19 通道 EEG 数据直接输入针对每个数据集定制的 1D CNN 模型。该模型在 Dataset A 上准确率达到 90.00%,Dataset B 上高达 98.74%,但在 Dataset C 上仅为 78.03% 。Dataset C 准确率较低,可能是因为信号复杂且数据预处理不够完善,反映出模型在该数据集上存在过拟合和泛化能力差的问题 。
- Case study C:基于 2D CNN 模型的诊断
EEG 信号经 Morlet 小波变换生成频谱图,2D CNN 模型对其进行处理。不同数据集的频谱图在神经同步性、信号复杂性、功率分布、EEG 节律稳定性等方面存在差异,如 Dataset A 中 AD 患者频谱同步性差,Dataset B 中 AD 患者信号复杂性低且功率分布偏向低频带 。2D CNN 模型在不同数据集上的表现也不同,Dataset A 准确率约为 91.10 - 91.92%,Dataset B 约为 86.25 - 87.61%,Dataset C 约为 66.00 - 66.20% 。通过混淆矩阵分析发现,不同类别之间存在特征重叠,导致部分样本分类错误 。
- 统计分析结果:通过 ANOVA 和 Wilcoxon Signed - Rank Test 等统计检验发现,数据集之间存在显著差异,但模型性能指标在某些检验中无显著差异 。Tuckey’s HSD 检验表明不同模型之间存在显著差异,说明数据集差异对模型性能有重要影响 。
研究结论与讨论
研究表明,1D 和 2D CNN 模型在痴呆诊断方面优于传统机器学习模型。1D CNN 能够捕捉 EEG 信号的时间特征,发现与神经退行性疾病相关的早期标记;2D CNN 可以从频谱图中提取复杂的时空模式,辅助诊断痴呆 。然而,研究也存在一些局限性,如计算资源有限导致交叉验证次数和训练轮数较少,可能影响模型性能;数据集不平衡、噪声处理不够完善以及数据集的异质性等问题,都可能对模型的泛化能力产生影响 。未来研究可通过先进的伪迹去除方法、优化特征提取技术、改进模型泛化能力以及结合多模态数据等方式进一步提升痴呆诊断的准确性和可靠性 。该研究为基于 EEG 信号的痴呆早期诊断提供了重要参考,为后续研究指明了方向,有望推动痴呆诊断技术的发展,帮助更多患者实现早期诊断和干预。