一种基于注意力引导的图谱脉冲方法，用于医疗领域的癫痫发作定位与检测

《Healthcare Analytics》：An Attention-Guided Graph Spiking Approach for Seizure Localization and Detection in Healthcare

【字体：大中小】 时间：2025年11月15日 来源：Healthcare Analytics CS4.4

编辑推荐：

　　癫痫检测中的混合GNN-SNN模型通过整合图注意力机制与脉冲神经网络，实现了高精度、高可解释性的患者特定癫痫检测。该模型利用k最近邻图构建EEG通道的时空关系，结合自适应Leaky Integrate-and-Fire神经元捕捉生物启发的时序动态，并借助注意力权重量化各EEG通道的贡献度。在CHB-MIT数据集上验证，平均准确率98.94%，敏感性95.01%，特异性99.23%，同时通过GNNExplainer和注意力机制的一致性分析，证明了模型在空间关联捕捉和可解释性上的有效性。该框架为可穿戴设备实时监测提供了能量高效的解决方案。

　　### 一种基于图神经网络与脉冲神经网络的患者特异性癫痫发作检测框架

癫痫是一种慢性神经系统疾病，其特征是反复出现的发作性癫痫发作。这种疾病的诊断和治疗面临着重大挑战，尤其是在癫痫发作的及时识别方面。由于癫痫发作具有高度的不可预测性，传统的基于人工的癫痫发作识别方法往往需要大量的劳动、时间和专业知识，从而限制了其在临床环境中的应用。为了解决这一问题，本研究提出了一种结合图神经网络（GNN）与脉冲神经网络（SNN）的混合模型，旨在实现更高效、更准确的癫痫发作检测，同时增强模型的可解释性。

该混合框架通过引入注意力机制来估计通道的重要性，并结合基于图的脉冲动力学模型，使模型能够理解不同脑区之间的空间关系和时间动态。具体来说，将每个EEG通道视为图中的节点，利用多头图注意力层来捕捉这些节点之间的空间关系。同时，采用自适应漏斗积分-火（Adaptive Leaky Integrate-and-Fire）神经元来模拟生物启发的时间动态。这种设计使得模型能够在识别癫痫发作的同时，提供关于哪些EEG通道对癫痫检测贡献最大的可解释性信息。

为了确保模型的有效性，该框架针对每个患者单独训练和优化，以学习其独特的空间和时间EEG模式。这种患者特异性设计使得模型能够适应不同个体的EEG特征，从而提高检测的准确性。同时，模型采用统一的架构，以确保其在不同患者中的可重复性和可扩展性。在CHB-MIT数据集上的实验结果表明，该模型在准确率、敏感性和特异性方面均表现出色，分别达到98.94%、95.01%和99.23%。这些结果不仅验证了模型的高效性，还展示了其在可解释性方面的优势。

然而，尽管该模型在识别癫痫发作方面表现优异，它并不适合用于临床定位。由于其主要关注于癫痫发作的主导通道，因此在实际应用中，仍需通过颅内EEG（iEEG）进行验证。此外，该模型在处理大规模数据和实时监测方面也存在一定的挑战，因此未来的研究将致力于验证其在临床标准下的有效性，推广到患者无关的场景，并开发更加节能的版本，以便于在低功耗设备上进行实时监测。

### EEG数据预处理与图结构构建

在构建模型之前，EEG数据需要经过一系列预处理步骤，以确保其质量和适用性。首先，数据被标准化处理，以消除不同EEG记录之间的差异。其次，使用零相位的四阶巴特沃斯带通滤波器对原始数据进行滤波，以去除低频漂移和高频噪声。这一过程确保了模型能够捕捉到与癫痫相关的EEG节奏。

随后，将EEG数据分割为非重叠的1秒窗口，每个窗口的大小和步长为256个样本，这与采样率一致。对于每个分割后的窗口，如果其在时间上与已标注的癫痫发作区间重叠，则被标记为癫痫发作（label 1），否则被标记为非癫痫发作（label 0）。这一过程确保了模型能够处理连续的EEG数据，并将其转换为适合训练的格式。

为了捕捉EEG通道之间的空间关系，构建了一个基于距离的k最近邻图（k=4）。每个通道的位置被估计为电极对的中点，根据标准的10-20电极布局系统。这样，图的边可以捕捉到局部的空间关系，而不是所有通道之间的均匀连接。通过这种方式，模型能够更准确地反映癫痫发作的空间动态。

此外，为了增强模型的可解释性，将所有EEG图段序列化并存储为PyTorch文件，以便于患者特异性分析和高效重用。在构建数据集时，使用训练数据计算的全局均值和标准差对节点特征进行归一化，以确保所有EEG段之间的特征缩放一致，并减少文件间的差异。采用随机分割方法将数据集分为训练、验证和测试子集，同时保持患者特异性评估协议。为了应对癫痫与非癫痫样本之间的类别不平衡，采用加权随机采样方法，确保在训练过程中两类样本都能得到公平的代表。

### 图神经网络的应用

图神经网络（GNNs）在癫痫分析中展现出巨大潜力，因其能够有效建模EEG通道之间的空间关系和相互作用。在癫痫检测中，异常的脑电活动通常会通过多个脑区传播，GNNs能够学习这些脑区之间的依赖关系和影响模式。通过引入注意力机制，GNNs可以为不同通道赋予不同的重要性权重，从而产生可解释的评分，指出可能参与癫痫活动的电极。

这种基于注意力的机制不仅能够生成关于候选区域的假设信息，还能提供初步的癫痫活动定位线索。然而，需要注意的是，这些评分并不能确定癫痫的起始位置，而更多地指向可能参与癫痫活动的区域。因此，GNNs在癫痫检测中可以作为探索性工具，帮助研究人员识别可能的癫痫活动区域，并为后续的临床研究提供指导。

此外，GNNs的灵活性使其能够处理不同患者之间的EEG电极布局差异。这使得模型在处理不规则数据结构时更具优势，而传统的卷积神经网络（CNNs）在处理这类数据时往往面临挑战。通过将GNNs纳入混合框架，可以利用其对EEG通道之间关系的空间表示，从而提高癫痫检测的准确性和可解释性。

### 脉冲神经网络的特性

脉冲神经网络（SNNs）是一种受生物神经元行为启发的模型，能够通过稀疏的脉冲活动高效处理时间信息。这种稀疏性不仅降低了模型的计算复杂度，还使其在低功耗设备上具有更高的可行性。SNNs通过模拟神经元之间的脉冲依赖关系，能够识别不同持续时间和时间尺度的癫痫发作。

此外，SNNs能够透明地编码特征，以展示异常的EEG模式及其时间演化。这种特性增强了模型决策的可解释性，使得研究人员和临床医生能够更好地理解模型的工作原理。由于SNNs的计算方式与实际神经元的行为更为相似，因此它们能够更有效地处理复杂的神经信号。

然而，SNNs在处理复杂的空间关系方面存在一定的局限性。为了弥补这一缺陷，混合框架结合了GNNs和SNNs的优势，使模型能够同时捕捉空间和时间动态。这种结合不仅提高了检测的准确性，还提供了关于哪些通道可能参与癫痫活动的探索性见解。

### 混合模型的架构与训练策略

本研究提出的混合GNN-SNN模型，结合了图神经网络和脉冲神经网络的优势，以实现高效的癫痫检测。在模型架构中，EEG信号首先被投影到图G=(V, E)，其中每个节点v_i∈V对应一个EEG通道。通过构建基于距离的k最近邻图（k=4），模型能够捕捉到局部的电极间相互作用，而不是假设所有通道之间具有均匀连接。

每个EEG通道的时序段被用作节点的输入特征。为了获得更具信息量的表示，采用了一维卷积层和线性投影层组成的节点编码器。一维卷积能够捕捉短时的时序模式和局部信号动态，如节律性振荡和瞬态尖峰。经过ReLU激活和展平处理后，这些激活被投影到一个固定长度的紧凑嵌入中，以压缩高维的时序数据，保留与癫痫活动相关的判别性特征。

随后，这些编码的节点特征被传递到两个图注意力（GAT）层，每个层包含两个注意力头，以学习EEG节点之间的相互依赖关系。每个GAT层都采用了残差线性投影和层归一化，以稳定训练过程并保持梯度流动。同时，为了提高模型的泛化能力和鲁棒性，采用随机丢弃（dropout）技术。这些层能够动态分配注意力权重，以突出EEG通道之间的重要交互，并反映相邻节点的贡献。

在时间动态方面，模型采用了一个多尺度的时序注意力模块，该模块由两个并行的注意力子模块组成。每个子模块通过Tanh激活函数计算节点特征的标量注意力权重，并应用线性变换。通过softmax归一化的特征随后被用于时间上的加权聚合。为了强化时间显著的模式，同时保留底层信号，将输出与原始特征进行平均和拼接。这种双模块架构使得模型能够同时捕捉短时的瞬态尖峰和长时的节律活动，从而增强图级嵌入的时序感知能力。

在模型的最终分类阶段，图级嵌入被传递到一个脉冲读出层，该层通过生物启发的脉冲神经元动态将特征转换为类别得分。读出模块由一个全连接层和一个自适应漏斗积分-火（LIF）神经元组成，模拟脉冲行为。在每个时间步骤中，神经元整合当前输入和膜电位，以生成脉冲响应。膜衰减因子（β）是可学习的，并被限制在一个有限的范围内，以支持神经元对时间记忆的灵活调节。最终的预测结果是通过对所有时间步骤的脉冲输出取平均值得出的，从而捕捉到时间动态和脉冲行为。

为了提高模型的可解释性，结合了空间注意力、时间加权、全局池化和生物启发的脉冲读出机制。这些机制使得模型能够突出最具信息量的通道和时间特征，从而提高对EEG数据中微妙预发作模式的敏感性。该混合GNN-SNN模型的架构如图2所示。

### 模型训练与测试

在训练过程中，模型针对每个患者单独进行训练，仅使用该患者的EEG记录。这种患者特异性训练策略确保了模型能够学习到每个个体独特的癫痫活动模式。训练、验证和测试均在同一位患者的EEG段上进行，而不将数据与其他患者混合，以保持模型的泛化能力和准确性。

数据集被划分为三个子集：70%用于训练，20%用于验证，10%用于测试。为每个子集分别创建了数据加载器，以进行训练和评估。训练加载器采用64的批量大小，并使用平衡的批量采样器确保癫痫和非癫痫样本的平衡，同时通过洗牌数据以促进模型的泛化能力。验证和测试加载器同样使用64的批量大小，但不进行洗牌，以确保测试的稳定性。

在特征归一化方面，仅使用训练集计算的统计信息，以避免数据泄漏。将所有训练图的节点特征进行拼接，以确定训练数据集的均值和标准差。然后，使用这些参数对验证和测试集的特征进行归一化，以确保特征缩放的一致性，同时保持训练数据与未见过的数据之间的严格分离。为了应对类别不平衡问题，采用自适应正类权重计算，以增强模型对少数类别样本的关注。为了防止梯度不稳定，将权重限制在一个稳定的范围内。

采用了一种结合Lookahead和Adam的混合优化方法，以提高训练的稳定性和泛化能力。Adam通过根据梯度的一阶和二阶矩独立调整每个参数，以实现更快和更可靠的学习。Lookahead则在Adam的基础上添加了一层优化，通过使用两个权重集合：缓慢更新的权重和快速更新的权重，以提高模型的训练效率。学习率的调整由ReduceLROnPlateau调度器监控验证损失，并在验证性能停滞时降低学习率。梯度剪裁（gradient clipping）避免了反向传播过程中梯度爆炸的问题，而梯度累积（gradient accumulation）则在不增加内存需求的情况下提高了有效批量大小。

在训练过程中，脉冲读出层的脉冲动态被用来计算类别logits，即通过对模拟步骤中脉冲活动的平均值来表示模型的决策输出。这些logits随后被传递到Focal Loss函数，以解决类别不平衡问题，并增强模型对挑战性样本的关注。通过将获得的Focal Loss值在梯度累积步骤中求和并反向传播，以更新网络参数。为了防止过拟合并减少不必要的计算，采用了早停策略。模型最多可训练100个epochs，但如果验证集上的F1分数在连续多个epochs中没有改善，则训练过程会提前停止。

在验证阶段，模型以推理模式运行，权重被冻结。脉冲输出通过softmax函数被归一化为类别概率，并根据自适应优化的概率阈值进行预测，以保持高敏感性。模型的性能通过准确率、敏感性、特异性和F1分数等指标进行评估，以确保模型能够实现有效的学习、泛化和稀疏脉冲表示。

### 模型的性能与讨论

在CHB-MIT数据集上，模型的性能被评估，以验证其在癫痫检测中的有效性。为了测试模型的区分能力，使用了一组患者的子集，以区分间期和发作期的EEG段。由于模型是患者特异性的，因此需要为每位患者单独训练一个模型，以学习其独特的癫痫活动模式。考虑到为每位患者训练模型的计算成本较高，仅选择了15位患者进行训练。这些患者具有从3到14次癫痫发作的不同频率，代表了低频和高频癫痫发作人群。这种选择策略保留了CHB-MIT数据集中癫痫特征的异质性，同时使得患者特异性模型的训练成为可能。

模型在每位患者上进行了训练和测试，以创建患者特异性癫痫检测模型。模型的性能通过准确率、敏感性、特异性和F1分数等指标进行评估，以确保其能够实现有效的学习、泛化和稀疏脉冲表示。在CHB-MIT数据集上的实验结果表明，该模型在准确率、敏感性和特异性方面均表现出色，分别达到了98.94%、95.01%和99.23%。这些结果不仅验证了模型的高效性，还展示了其在可解释性方面的优势。

为了进一步验证模型的可解释性，分析了不同患者中EEG通道的重要性。使用GNNExplainer和基于注意力的方法，计算了每个通道在模型决策中的贡献。通过比较这两种方法的结果，发现它们在大多数患者中具有较高的重叠分数和相似的余弦相似度、皮尔逊相关性和斯皮尔曼相关性。这表明，虽然患者特异性因素可能影响通道排名的精确性，但两种方法在识别重要通道方面具有良好的一致性。

此外，模型的能效分析也显示了其在低功耗设备上的适用性。通过计算每个患者在推理过程中脉冲读出层的平均脉冲数，发现SNN的计算量比传统的ANN减少了近50%。这种能效的提升是由于SNN的稀疏性，使得模型能够在不牺牲性能的情况下，实现更低的计算需求。这种结果对于开发实时的癫痫监测系统具有重要意义，因为低功耗和高效计算是这些系统的关键要求。

### 与现有方法的比较

为了评估模型的性能，将其与现有的癫痫检测方法进行了比较。例如，Yuan等人使用STFT和卷积自编码器，取得了94.37%的准确率，但未报告敏感性和特异性，且缺乏对长期EEG依赖的建模能力。Z. Wei等人采用3D CNN，结合二维EEG图像和体积表示，取得了84%的准确率和72.11%的敏感性，但特异性较高。这种结果表明，虽然模型在准确性方面有所提升，但其在捕捉癫痫事件方面存在一定的偏差。

Selvakumari等人采用主成分分析（PCA）和混合分类器，取得了95.63%的准确率、95.7%的敏感性和96.55%的特异性。然而，由于PCA的使用，一些重要的EEG特征可能被丢失，从而影响模型对癫痫相关模式的提取。Y. Li等人提出的模型结合了全卷积网络（FCN）和嵌套LSTM，取得了95.29%的准确率、95.42%的敏感性和95.29%的特异性。尽管模型有效，但其序列处理设计限制了其可扩展性和效率。

相比之下，本研究提出的模型在准确率和特异性方面均优于现有方法。Hu等人提出的深度Bi-LSTM模型取得了93.61%的敏感性和91.85%的特异性，但未报告准确率。这表明，虽然该模型在某些指标上表现良好，但其整体性能仍有限。Kaziha等人采用CNN和分类器，取得了96.74%的准确率和100%的特异性，但敏感性较低，表明癫痫事件可能被遗漏。Yao等人结合Bi-LSTM和注意力机制，取得了86.30%的准确率、86.60%的敏感性和86%的特异性。尽管注意力机制增强了对显著区域的强调，但由于缺乏强大的空间特征提取，整体性能仍然受限。

Hassan等人采用CNN和LSTM的混合方法，取得了约98%的准确率，但未报告敏感性和特异性，使得其性能难以全面评估。Y. Zhang等人采用Bi-GRU和小波特征，取得了98.49%的准确率、93.89%的敏感性和98.49%的特异性。尽管该模型表现良好，但缺乏对通道间关系的建模，限制了其性能。Tao等人提出的图同构网络取得了96.2%的准确率、95.4%的敏感性和97%的特异性。他们的模型在捕捉空间和时间依赖关系方面表现出色，但计算成本较高，使其难以应用于长期和实时监测。

Landi等人提出了一种基于Transformer编码器的跨受试癫痫检测系统，通过数据融合来应对类别不平衡，并采用混合监督-无监督学习框架和自适应损失函数来增强空间-时间特征提取。然而，该系统未报告准确率和精确度指标，使得其性能评估存在一定的局限性。相比之下，本研究提出的模型在准确率、敏感性和特异性方面均优于现有方法，并且提供了关于通道重要性的可解释性信息。

### 结论

癫痫的早期和准确检测对于临床实践至关重要，尤其是在需要手动解释EEG记录的场景中，这种过程往往耗时且依赖于专业知识。因此，自动化系统在癫痫检测中具有显著的优势，能够提供关于可能涉及的皮层区域的潜在线索，从而支持诊断和个性化治疗。图神经网络在建模EEG通道之间的空间关系方面表现出色，而脉冲神经网络则能够捕捉生物启发的时间动态。通过引入注意力机制，这两种方法能够增强模型的可解释性，从而识别对模型决策影响最大的电极。

本研究提出的混合GNN-SNN模型结合了这两种方法的优势，使得模型在癫痫检测中既能够捕捉空间关系，又能够处理时间动态。模型在CHB-MIT数据集上的表现表明，其在准确率、敏感性和特异性方面均具有较高的性能。此外，模型通过基于注意力的通道重要性估计，提供了关于模型驱动注意力空间分布的假设生成信息。这些拓扑图通过注意力机制生成的通道重要性值，为研究人员和临床医生提供了有价值的线索，以指导未来的临床研究。

尽管该模型在癫痫检测中表现出色，但它并不适合用于临床定位，因此仍需通过颅内EEG（iEEG）进行验证。未来的工作将集中在验证该模型在临床标准下的有效性，评估其在更大、更广泛的患者群体中的表现，并开发更加节能的版本，以便于在低功耗设备上进行实时监测。通过提升模型的可解释性和效率，本研究提出的框架为下一代智能决策支持系统在癫痫护理中的应用提供了重要的基础。

热点排行