基于双路径注意力融合网络的EEG情绪识别:CNN与图全局建模的协同方法
《Array》:DAFNet: A dual-path attention fusion network for EEG emotion recognition via CNN and graph-based global modeling
【字体:
大
中
小
】
时间:2025年11月05日
来源:Array 4.5
编辑推荐:
本文推荐一项创新性研究,针对当前脑电(EEG)情绪识别中存在的模型泛化能力弱、对受试者间变异和信号噪声敏感等问题,研究人员提出了DAFNet(双路径注意力融合网络)。该模型通过整合局部空间频率特征(DE)和全局通道间同步性特征(SCS),利用2D CNN与图注意力变换器(GAT)及全局协方差池化(GCP)进行双路径建模与特征融合。在SEED和DEAP数据集上的测试准确率分别达到97.73%和97.89%,显著优于现有方法。这项工作为开发高精度、强泛化能力的EEG情绪识别系统提供了可扩展的框架,推动了情感计算与脑机接口(BCI)的实用化进程。
情绪,作为人类认知、决策和社交互动的核心要素,在心理健康评估、自适应学习以及人机交互(HCI)领域具有至关重要的作用。传统的情感识别方法大多依赖于面部表情、语音或心率、皮电反应等生理信号,但这些外部表现易受环境因素、主观控制和文化差异的影响,难以保证客观性和稳定性。相比之下,基于脑电图(EEG)的情绪识别技术能够直接捕捉与情绪状态相关的大脑电生理活动,提供了更为直接和客观的分析途径。然而,EEG信号本身具有高噪声、非平稳性以及显著的个体间差异,使得构建鲁棒且泛化能力强的情绪分类模型面临巨大挑战。尽管深度学习技术,特别是卷积神经网络(CNN),在从EEG信号中学习空间-频率模式方面展现出巨大潜力,但现有模型往往难以同时兼顾局部精细特征和全局通道间拓扑关系,限制了其性能的进一步提升。
为了应对上述挑战,来自库尔纳工程技术大学(Khulna University of Engineering & Technology)的Md Raihan Khan等研究人员在《Array》期刊上发表了题为“DAFNet: A dual-path attention fusion network for EEG emotion recognition via CNN and graph-based global modeling”的研究论文。他们提出了一种新颖的双路径注意力融合网络——DAFNet,旨在通过整合局部神经动态和全局功能连接模式,显著提升EEG情绪分类的准确性和鲁棒性。
研究人员为开展此项研究,主要运用了几项关键技术方法。首先,他们建立了一套标准化的EEG数据预处理流程,包括对来自SEED、DEAP和GAMEEMO等多个公共数据集的原始信号进行下采样、带通滤波(0.5–45 Hz)以及基于独立成分分析(ICA)的伪迹去除。接着,他们从预处理后的信号中提取了两类关键特征:用于捕捉局部空间-频率模式的微分熵(Differential Entropy, DE),以及用于量化通道间相位同步性的频谱相干对称性(Spectral Coherence Symmetry, SCS)。在此基础上,他们设计了DAFNet模型架构,其核心是一个双分支网络:局部路径采用带有通道注意力的二维卷积神经网络(2D CNN)处理DE特征;全局路径则利用图注意力变换器(Graph Attention Transformer, GAT)和全局协方差池化(Global Covariance Pooling, GCP)对SCS特征进行图结构建模。最后,通过融合两个路径学习到的特征表示,送入分类器进行情绪状态(积极、中性、消极)的推断。
DAFNet模型的核心创新在于其双路径设计。局部路径将EEG信号的微分熵(DE)特征(形式为通道×时间窗口×频率带)视为二维空间图,通过一系列卷积层、池化层和Dropout层进行层次化特征提取,以捕获每个电极及其邻近区域在特定频带上的活动模式。全局路径则专注于电极之间的功能连接关系。它将每个EEG通道视为图中的一个节点,节点特征由SCS值构成,并利用图注意力网络(GAT)动态学习节点(即通道)之间的相互重要性权重,从而自适应地建模大脑网络连接。随后,通过全局协方差池化(GCP)聚合所有节点的特征,捕获其二阶统计信息,形成一个紧凑且信息丰富的全局表示。最终,局部路径和全局路径学习到的特征向量被拼接起来,通过全连接层和Softmax激活函数完成最终的分类任务。
研究中对原始EEG信号进行了严谨的预处理。包括将信号下采样至128 Hz,应用0.5-45 Hz的带通滤波器以去除噪声和漂移,并采用独立成分分析(ICA)来识别和剔除与眼动、肌肉活动等相关的伪迹成分。特征提取阶段,利用短时傅里叶变换(STFT)计算信号的频谱,进而推导出微分熵(DE)和频谱相干对称性(SCS)。DE特征基于脑电信号在特定频带(δ, θ, α, β, γ)的功率近似服从高斯分布的假设,计算其微分熵,从而反映该频带的能量复杂度。SCS特征则通过计算不同通道对在同一频带内的相位同步性平均值,来刻画大脑区域之间的功能连接强度。
在SEED数据集上的系统评估表明,DAFNet模型取得了卓越的性能,测试准确率达到97.73%,精确度(Precision)、召回率(Recall)和F1分数(F1-Score)均超过97.9%。消融实验证实了双路径设计的有效性:单独使用局部路径(2D CNN)或全局路径(GAT/GCP)的准确率分别为94.72%和93.85%,而二者的融合带来了显著的性能提升。此外,模型在外部验证数据集DEAP和GAMEEMO上分别达到了97.89%和95.53%的准确率,证明了其强大的跨数据集泛化能力。与现有先进方法(如Bi-ViTNet, DEVAE-GAN, DGAT等)相比,DAFNet在SEED数据集上均表现出明显优势。
为了增强模型的可解释性,研究人员应用了平滑梯度加权类激活图(Smooth Grad-CAM, SG-CAM)技术来可视化局部CNN路径所关注的关键脑区。结果显示,在识别积极情绪时,模型更关注左侧前额叶区域(如F3, F7, Fp1),这与神经科学中左侧前额叶活动与积极情绪相关的“前额叶alpha不对称性”理论相符。而在识别消极情绪时,注意力则更多地集中在右侧前额叶和颞叶区域(如F4, Fp2, T4)。这种与已知生理机制的一致性,增强了DAFNet决策过程的生物合理性可信度。
综上所述,这项研究成功地开发并验证了DAFNet这一创新的双路径深度学习框架。该模型通过协同利用局部空间-频率特征(DE)和全局通道间连接特征(SCS),有效地克服了传统EEG情绪识别模型在泛化性和鲁棒性方面的局限。研究结果不仅展示了DAFNet在多个公开数据集上达到领先水平的分类性能,还通过可解释性分析揭示了其决策机制与神经科学理论的吻合之处。这项工作为构建更加准确、可靠且易于解释的脑机接口(BCI)和情感计算系统提供了重要的技术支撑和理论依据,标志着向实用化EEG情绪识别迈出了关键一步。未来,融合自监督学习、领域自适应等前沿技术有望进一步推动该领域的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号