基于双路径注意力融合网络的EEG情绪识别：CNN与图全局建模的协同方法

《Array》：DAFNet: A dual-path attention fusion network for EEG emotion recognition via CNN and graph-based global modeling

【字体：大中小】 时间：2025年11月05日 来源：Array 4.5

编辑推荐：

　　本文推荐一项创新性研究，针对当前脑电（EEG）情绪识别中存在的模型泛化能力弱、对受试者间变异和信号噪声敏感等问题，研究人员提出了DAFNet（双路径注意力融合网络）。该模型通过整合局部空间频率特征（DE）和全局通道间同步性特征（SCS），利用2D CNN与图注意力变换器（GAT）及全局协方差池化（GCP）进行双路径建模与特征融合。在SEED和DEAP数据集上的测试准确率分别达到97.73%和97.89%，显著优于现有方法。这项工作为开发高精度、强泛化能力的EEG情绪识别系统提供了可扩展的框架，推动了情感计算与脑机接口（BCI）的实用化进程。

情绪，作为人类认知、决策和社交互动的核心要素，在心理健康评估、自适应学习以及人机交互（HCI）领域具有至关重要的作用。传统的情感识别方法大多依赖于面部表情、语音或心率、皮电反应等生理信号，但这些外部表现易受环境因素、主观控制和文化差异的影响，难以保证客观性和稳定性。相比之下，基于脑电图（EEG）的情绪识别技术能够直接捕捉与情绪状态相关的大脑电生理活动，提供了更为直接和客观的分析途径。然而，EEG信号本身具有高噪声、非平稳性以及显著的个体间差异，使得构建鲁棒且泛化能力强的情绪分类模型面临巨大挑战。尽管深度学习技术，特别是卷积神经网络（CNN），在从EEG信号中学习空间-频率模式方面展现出巨大潜力，但现有模型往往难以同时兼顾局部精细特征和全局通道间拓扑关系，限制了其性能的进一步提升。

为了应对上述挑战，来自库尔纳工程技术大学（Khulna University of Engineering & Technology）的Md Raihan Khan等研究人员在《Array》期刊上发表了题为“DAFNet: A dual-path attention fusion network for EEG emotion recognition via CNN and graph-based global modeling”的研究论文。他们提出了一种新颖的双路径注意力融合网络——DAFNet，旨在通过整合局部神经动态和全局功能连接模式，显著提升EEG情绪分类的准确性和鲁棒性。

研究人员为开展此项研究，主要运用了几项关键技术方法。首先，他们建立了一套标准化的EEG数据预处理流程，包括对来自SEED、DEAP和GAMEEMO等多个公共数据集的原始信号进行下采样、带通滤波（0.5–45 Hz）以及基于独立成分分析（ICA）的伪迹去除。接着，他们从预处理后的信号中提取了两类关键特征：用于捕捉局部空间-频率模式的微分熵（Differential Entropy, DE），以及用于量化通道间相位同步性的频谱相干对称性（Spectral Coherence Symmetry, SCS）。在此基础上，他们设计了DAFNet模型架构，其核心是一个双分支网络：局部路径采用带有通道注意力的二维卷积神经网络（2D CNN）处理DE特征；全局路径则利用图注意力变换器（Graph Attention Transformer, GAT）和全局协方差池化（Global Covariance Pooling, GCP）对SCS特征进行图结构建模。最后，通过融合两个路径学习到的特征表示，送入分类器进行情绪状态（积极、中性、消极）的推断。

模型架构

DAFNet模型的核心创新在于其双路径设计。局部路径将EEG信号的微分熵（DE）特征（形式为通道×时间窗口×频率带）视为二维空间图，通过一系列卷积层、池化层和Dropout层进行层次化特征提取，以捕获每个电极及其邻近区域在特定频带上的活动模式。全局路径则专注于电极之间的功能连接关系。它将每个EEG通道视为图中的一个节点，节点特征由SCS值构成，并利用图注意力网络（GAT）动态学习节点（即通道）之间的相互重要性权重，从而自适应地建模大脑网络连接。随后，通过全局协方差池化（GCP）聚合所有节点的特征，捕获其二阶统计信息，形成一个紧凑且信息丰富的全局表示。最终，局部路径和全局路径学习到的特征向量被拼接起来，通过全连接层和Softmax激活函数完成最终的分类任务。

特征提取与预处理

研究中对原始EEG信号进行了严谨的预处理。包括将信号下采样至128 Hz，应用0.5-45 Hz的带通滤波器以去除噪声和漂移，并采用独立成分分析（ICA）来识别和剔除与眼动、肌肉活动等相关的伪迹成分。特征提取阶段，利用短时傅里叶变换（STFT）计算信号的频谱，进而推导出微分熵（DE）和频谱相干对称性（SCS）。DE特征基于脑电信号在特定频带（δ, θ, α, β, γ）的功率近似服从高斯分布的假设，计算其微分熵，从而反映该频带的能量复杂度。SCS特征则通过计算不同通道对在同一频带内的相位同步性平均值，来刻画大脑区域之间的功能连接强度。

实验结果

在SEED数据集上的系统评估表明，DAFNet模型取得了卓越的性能，测试准确率达到97.73%，精确度（Precision）、召回率（Recall）和F1分数（F1-Score）均超过97.9%。消融实验证实了双路径设计的有效性：单独使用局部路径（2D CNN）或全局路径（GAT/GCP）的准确率分别为94.72%和93.85%，而二者的融合带来了显著的性能提升。此外，模型在外部验证数据集DEAP和GAMEEMO上分别达到了97.89%和95.53%的准确率，证明了其强大的跨数据集泛化能力。与现有先进方法（如Bi-ViTNet, DEVAE-GAN, DGAT等）相比，DAFNet在SEED数据集上均表现出明显优势。

模型可解释性

为了增强模型的可解释性，研究人员应用了平滑梯度加权类激活图（Smooth Grad-CAM, SG-CAM）技术来可视化局部CNN路径所关注的关键脑区。结果显示，在识别积极情绪时，模型更关注左侧前额叶区域（如F3, F7, Fp1），这与神经科学中左侧前额叶活动与积极情绪相关的“前额叶alpha不对称性”理论相符。而在识别消极情绪时，注意力则更多地集中在右侧前额叶和颞叶区域（如F4, Fp2, T4）。这种与已知生理机制的一致性，增强了DAFNet决策过程的生物合理性可信度。

综上所述，这项研究成功地开发并验证了DAFNet这一创新的双路径深度学习框架。该模型通过协同利用局部空间-频率特征（DE）和全局通道间连接特征（SCS），有效地克服了传统EEG情绪识别模型在泛化性和鲁棒性方面的局限。研究结果不仅展示了DAFNet在多个公开数据集上达到领先水平的分类性能，还通过可解释性分析揭示了其决策机制与神经科学理论的吻合之处。这项工作为构建更加准确、可靠且易于解释的脑机接口（BCI）和情感计算系统提供了重要的技术支撑和理论依据，标志着向实用化EEG情绪识别迈出了关键一步。未来，融合自监督学习、领域自适应等前沿技术有望进一步推动该领域的发展。

热点排行