《Brain‐X》:Detection of K-Complexes and sleep spindles using a hybrid TCN and KAN architecture
摘要
睡眠障碍是重要的公共卫生问题。脑电图(EEG)分析通过识别K复合波(K-complexes)和睡眠纺锤波(sleep spindles)等关键生物标志物,为评估神经状态提供了有效手段。本研究提出了一种基于时序卷积网络(Temporal Convolutional Network, TCN)和柯尔莫哥洛夫-阿诺德网络(Kolmogorov-Arnold Network, KAN)的混合架构。模型在DREAMS数据集上进行了评估,K复合波检测准确率达到93.18%,纺锤波达到86.26%,在所有指标上均比基线TCN模型提升1%–2%。这些结果验证了KAN在时域信号分类中的有效性。值得注意的是,多层KAN配置未能带来额外的性能提升。此外,本研究开发了一个利用EEG生物标志物进行睡眠分期识别的框架,将生理学上相似的睡眠阶段合并为三个宏观类别,在DREAMS数据集的K复合波子集和纺锤波子集上分别达到了79.7%和68.4%的分类准确率。扩展此方法,我们基于睡眠阶段时长比例实现了一个五阶段识别系统,在Haaglanden Medisch Centrum(HMC)数据集上取得了81.6%的准确率。这项工作支持了利用特征性EEG波形进行自动睡眠分期的可行性。
1 引言
睡眠在人类神经发育中扮演核心角色。平均而言,成年人每天有六分之一到三分之一的时间在睡眠中度过,新生儿则大部分时间都在睡眠。长期睡眠不佳的个体易患失眠、焦虑等神经系统疾病。因此,研究睡眠期间脑电波的改变对于理解人类神经发育过程至关重要。
在成人中,睡眠分期框架通常将脑电图记录分为五个状态:清醒期(Wake, W)、快速眼动睡眠期(Rapid-Eye-Movement, REM)以及三个非快速眼动睡眠期(N1, N2, N3)。睡眠纺锤波和K复合波是睡眠期间两种常见的EEG波形模式。
纺锤波的振幅为20–100 μV,持续时间为0.5–2 s,信噪比(Signal-to-Noise Ratio, SNR)在3到8之间。睡眠纺锤波通常指频率在11–17 Hz范围内的振荡活动爆发。K复合波是人类睡眠EEG中最显著的波形之一,表现为双相或三相波,通常以大约30–60秒的间隔出现。K复合波的振幅为50–200 μV,持续时间为0.8–1.2 s,SNR在6到15之间。在睡眠期间,通过检测EEG信号中这两种波形的出现频率可以评估神经成熟度。先前研究表明,K复合波与癫痫和阿尔茨海默病的发生发展相关。睡眠EEG中K复合波和纺锤波频率的检测可能作为此类神经系统疾病的预测因子。
现有的纺锤波检测方法已从依赖波形形态学的事件查找发展到使用复杂的数学模型进行事件检测。Jiang等人使用参数自适应Teager能量算子方法,在DREAMS数据集上取得了F1值为0.69的成绩。Wei等人采用随机森林机器学习方法检测婴儿EEG中的纺锤波,灵敏度达到93.3%–93.9%,特异性达到90.7%–91.5%,准确率达到89.2%–90.1%。Kaulen等人设计了U-NET神经网络模型用于纺锤波检测,并将其应用于老年人(其EEG模式复杂,检测更具挑战性)的纺锤波检测。
大多数现有的K复合波检测方法涉及EEG特征提取。Hernández-Pereira等人从波形的振幅和持续时间等特征入手,达到了91.4%的准确率。Kantar和Erdamar使用EEG信号中瞬态波形的特定振幅和频率作为特征,灵敏度达到70.83%,特异性达到85.29%。Oliveira等人提出了一种多锥度方法从频谱角度检测K复合波,平均召回率达到85.10 ± 5.05%,平均准确率达到68.80 ± 10.22%。Al-Salman等人使用最小二乘支持向量机方法处理从EEG信号中提取的22个特征,准确率达到97.7%,灵敏度达到97%,特异性达到94.2%。然而,其马修斯相关系数(Matthew's Correlation Coefficient, MCC)平均值仅为47%,低于大多数K复合波检测算法。基于时域和频域分析以及混沌理论得到的多域特征,Li等人应用了各种经典分类方法并结合特征筛选技术,准确率达到93.03%,灵敏度达到93.81%,特异性达到94.13%。
随着神经网络的日益普及,一些研究者开始使用神经网络算法进行K复合波检测。Ranjan等人提出了一种模糊神经网络方法,在测试信号上平均准确率达到87.65%,灵敏度达到94.04%,特异性达到76.2%。Khasawneh等人将含有K复合波的EEG片段视为图像,并使用多种神经网络模型检测K复合波的位置,其方法最高准确率达到99.8%,漏检率为0.2%。次年,他们在相同的图像数据集上使用YOLOv3模型,最高准确率达到89.84%–99.44%,漏检率为10.41%–0.55%。尽管基于图像的EEG数据片段处理可以实现模型迁移并利用现有架构获得强劲结果,但它未能利用EEG信号的时间特性。此外,基于图像的方法需要大量计算能力,并且其结果受事件重叠标准的影响。
当前研究表明,神经网络模型已成为检测EEG特征波形的主流方法。尽管这些模型可以达到很高的准确率,但它们通常存在计算成本高、处理时间长的问题。为解决此问题,本研究提出了一种混合时序卷积网络-柯尔莫哥洛夫-阿诺德网络(TCN-KAN)模型,旨在在多个评估指标上展现出稳健的性能。
2 方法
2.1 数据集
本研究特征波形检测部分使用的纺锤波和K复合波数据集来自DREAMS数据库。K复合波数据集提供了10个EEG睡眠片段样本,采样率为200 Hz,持续时间为30分钟。纺锤波数据集包含8名参与者在30分钟睡眠阶段的EEG数据,数据参数与K复合波数据集相似。
实验选择的通道是Cz–A1通道,数据未经过任何滤波。两位专家为数据提供了特征波形标注。由于只有第一位专家标注了所有10个样本,因此数据集基于第一位专家的标注结果构建。基于先前研究,EEG数据经过预处理并在1–30 Hz范围内进行滤波。选择滑动窗口为0.5秒、步长为0.1秒的EEG片段作为数据集;选取2000个标记为特征波形的片段和所有非特征波形片段,总计4000个片段。使用与先前研究相同的窗口和步长参数旨在提高下文所述网络性能比较的可靠性。数据集被随机划分,80%指定为训练集,20%为测试集。由于上述两个数据集中包含睡眠阶段标签,因此也使用这两个数据集进行了睡眠分期识别测试。
Haaglanden Medisch Centrum(HMC)数据集回顾性收集了来自荷兰海牙睡眠中心数据库的151份多导睡眠图(Polysomnography, PSG)记录。患者记录是从2018年转诊进行PSG检查的异质性患者群体中随机选择的。该研究旨在评估跨最常见和异质性患者表型的性能和可靠性,因此未应用额外的选择标准。该集合包括医院内和门诊记录的组合。经过专业睡眠技师验证和生物校准后,在医院开始动态记录。这些记录是在常规临床流程中获得的。患者未接受标准临床工作流程之外的任何其他治疗或干预。数据完全匿名,以防止识别个体患者。PSG数据包括四个EEG通道(F4/M1, C4/M1, O2/M1, C3/M2)、两个眼电图通道(E1/M2, E2/M2)、一个双极下巴肌电图和一个心电图通道(单导联改良II导联)。睡眠阶段评分由训练有素的睡眠技师根据AASM指南2.4版手动执行。本实验使用C4–M1通道数据;所有信号以256 Hz采样,并选择每个记录中最稳定的500秒。本研究使用该数据集进行了睡眠分期测试。
2.2 K复合波与睡眠纺锤波在各睡眠阶段的分布
通过统计分析DREAMS数据库,揭示了在REM期没有特征波形事件发生。大量这类波形出现在睡眠第2阶段和第3阶段。具体而言,纺锤波在睡眠第2阶段占比较高,而K复合波在睡眠第3阶段占比较高。因此,可以从这两类特征波形的数量和相对比例推断当前的睡眠阶段。
2.3 模型架构:TCN-KAN混合网络
时序卷积网络是一种用于处理序列数据的神经网络架构。TCN整合了卷积神经网络和循环神经网络的优点,非常适合处理一维时间序列数据。本研究使用TCN对睡眠EEG信号中的K复合波和非K复合波进行分类。
该网络采用一个由TCN块组成的8层TCN网络。TCN块的结构如图所示。在结构上,它具有因果卷积、扩张卷积和残差连接的特点。TCN使用的卷积操作仅包含直到当前时间步的数据,强制执行严格的时间约束。TCN的多层架构旨在捕获更长时间范围内的信息。此外,TCN采用深度连接结构,在深层网络内促进跨层的信息传输。
KAN结构是一种广为人知的网络架构。一些研究表明它可以有效替代多层感知机结构并在一定程度上提高准确率。KAN是一种新颖的神经网络架构,通过用可学习的单变量函数替换权重参数来提高模型性能和可解释性。它可能是推动深度学习模型发展的关键工具。
其数学基础源于Kolmogorov-Arnold表示定理,该定理指出任何定义在有界域上的多元连续函数都可以精确地表示为单变量连续函数的有限组合。具体实现体现了这一思想:每个函数是一个单变量连续函数(通常参数化为样条),应用于各个输入维度,然后进行求和和另一个单变量函数。这种架构避免了固定的基函数,而是直接学习函数形式。相比之下,方程代表了传统的神经网络层,其中为可训练参数,σ(·)是固定的激活函数。虽然多层感知机使用加权和和非线性激活来近似复杂函数,但KAN通过自适应学习单变量函数的形状来实现表达性,通常以更少的参数获得相当的准确率。
KAN神经网络结构由三个连续的KAN层组成,本实验使用了最后一个KAN层。三层KAN网络的结构参考了MLP架构构建。单个KAN层对应于MLP结构中的线性层。
图展示了所提出的用于EEG信号分析的TCN-KAN/Linear模型的架构,包含五个子图,详细说明了其组件和设计原理。图说明了代表性的EEG信号成分:K复合波(上方实线)、纺锤波(下方实线)和背景EEG活动(虚线)。这些波形作为网络的输入特征。图描绘了整体网络架构。模型接收两个并行输入——K复合波和纺锤波信号,这些输入通过八个扩张TCN块进行处理。TCN的最终输出分叉为两个分支:一个馈入传统的线性层,另一个馈入KAN层。这种双输出设计实现了线性和基于KAN的表征之间的直接比较。图详细说明了每个TCN块的结构,依次由一维卷积层、丢弃层、Chomp层和ReLU激活组成。该序列在所有K=8个块中重复。图显示了Chomp模块,这是TCN架构中的关键组件,通过修剪因果卷积操作引入的多余填充来确保时间对齐。虽然未描绘其内部结构,但其功能对于保持感受野一致性至关重要。图比较了线性和KAN层的基本神经元结构。在线性神经元中,输入通过加权求和(具有可学习权重W1, …, Wn)组合,然后经过固定的非线性激活。相比之下,KAN神经元用单变量、可学习的基函数替换标量权重,使得非线性成为固有的、数据驱动的属性,而不是依赖固定的激活函数。这种架构差异允许KAN更灵活地建模复杂函数关系。
2.4 睡眠分期分类
在识别出纺锤波和K复合波之后,本研究尝试基于检测到的特征波形进行睡眠分期分类。由于这些波形在不同睡眠阶段以不同频率出现,我们量化了Dreams-Spindle和Dreams-K-complexes数据集中每个睡眠片段中两种波形类型的出现率。数据被分割成5秒的时段,总共产生360个时段,每个时段标有六个原始睡眠阶段之一。根据2007年AASM修订版,睡眠第3和第4阶段被合并为单个第3阶段, resulting in five stages.
为了满足睡眠深度管理的临床需求,采用了两种分类方案:三组方案和五组方案。使用线性回归,建立了一个模型来描述睡眠阶段标签与纺锤波和K复合波频率之间的关系,从而确定区分不同组的阈值。
2.5 评估指标
准确率反映分类结果中正确分类事件占总事件的比例。
精确率反映分类器或模型正确预测阳性样本的能力。值越高表示性能越好。
灵敏度反映分类器正确识别阳性样本的能力。值越高表示性能越好。
特异性反映分类器正确识别阴性类的能力。
F1值是精确率和灵敏度的加权调和平均值。值越高表示性能越好。F分数平衡了单独使用精确率或灵敏度的局限性,因为它同时考虑了阳性预测的两种度量。
MCC是一种综合性能度量,为不平衡数据集提供了更准确的评估。实践中,MCC值越高表示性能越好。
2.6 统计分析
为了定量评估所提出的TCN-KAN模型与基线TCN-Linear模型之间性能差异的显著性,采用了统计假设检验程序。鉴于我们的主要评估指标来自模型在同一测试集分区上多次运行的结果,我们执行了独立双样本t检验。选择此检验是为了比较在假设样本独立且近似正态分布的情况下,从两种模型架构获得的给定性能指标的均值。
对于纺锤波检测和K复合波检测任务,模型在相同的初始条件和数据分割下多次训练和评估。每次运行记录特定的感兴趣性能指标,生成两个不同的样本集:一个用于TCN-KAN模型,另一个用于TCN-Linear模型。零假设表示两种模型的平均性能没有显著差异。备择假设是存在显著差异。
显著性水平先验设定为0.01,以控制在跨任务和指标的多重比较中的I类错误。计算了t统计量,并得出了相应的p值。p值小于选定的显著性水平阈值被认为足以拒绝零假设,表明模型性能存在统计学显著差异。
3 结果
3.1 性能比较
实验中,学习率设置为0.002,批大小为100,每个TCN块后应用0.08的丢弃率。严格分离训练集和测试集以评估模型的泛化能力,降低过拟合或欠拟合的风险,并近似实际应用中的稳健性能。
表展示了与图对应的定量结果,显示了使用TCN-KAN和TCN-Linear架构进行纺锤波和K复合波检测的性能指标,加粗值代表每个模型-任务组合的最佳值。
如表所示,在比较TCN-KAN模型与TCN-Linear模型时,对于K复合波和纺锤波检测任务,KAN变体在大多数指标上(包括ACC、Precision、Specificity、MCC和F1)通常优于其线性对应物。值得注意的是,在纺锤波检测任务中,TCN-Linear模型获得了更高的Recall,而在K复合波任务中,Recall值几乎相等。总体准确率达到K复合波93.18%和纺锤波86.26%,表明TCN-KAN架构在识别关键睡眠波形方面具有竞争力。
如图所示,与线性层相比,KAN层在两种特征波形的分类中改善了几乎所有指标。替换后,精确度、特异性和MCC显著增加,准确率和F1分数提高了约1%。然而,用KAN层替换线性层后,灵敏度结果有所下降。
如图所示,混淆矩阵显示,与TCN-Linear相比,TCN-KAN模型显著减少了K复合波检测的假阴性和假阳性,表明其具有更强的判别能力。对于纺锤波检测,改进更为有限。这表明KAN层在检测K复合波事件方面比纺锤波事件提供更大的增益。
在纺锤波数据集上,两种模型的结果在显著性水平α=0.0005下进行检验,得到的p值分别为0.000018和0.000034,均小于α,表明两种模型之间存在显著差异。在K复合波数据集上,t检验得到的两个p值也低于α阈值,进一步证实了显著差异。
总体而言,将Kolmogorov-Arnold Network层纳入TCN架构在大多数性能指标上产生了统计学上的显著改进,特别是精确度、特异性、MCC和F1分数,适用于K复合波和纺锤波检测任务。尽管注意到纺锤波检测的Recall略有下降,但分类性能的整体提升肯定了基于KAN的方法的有效性。
3.2 学习率变化的影响
不同学习率下的性能结果相似,但存在细微差异。当学习率设置为0.001且所有其他参数不变时,准确率为92.3%。当学习率设置为0.002时,准确率为93.18%。当学习率设置为0.003时,准确率为93.05%。因此,选择0.002的学习率作为表中报告结果的标准。
3.3 计算效率分析
我们使用相同的K复合波数据集在同一台机器上测试了KAN层和线性层在计算时间上的差异。使用KAN层进行50轮训练和测试的总时间为20分钟6秒,而使用线性层的总时间为19分钟58秒,相差8秒。每轮的时间差<0.2秒,表明增加的时间相对较少。
3.4 训练损失比较
图中的图像显示了网络从第1轮到第30轮训练期间的负对数似然损失。在K复合波分类任务中,带有KAN层的模型获得了更低的最终损失。大约在第12轮左右,使用KAN层的模型已经将损失降低到较低水平。相比之下,纺锤波分类的损失曲线没有观察到显著差异。
3.5 多层KAN架构评估
在单层KAN取得有竞争力的结果后,我们评估了具有2-4层KAN的更深架构。如图所示,随着堆叠更多KAN层,性能指标普遍下降,尤其是超过两层时。然而,下降是适度的而非实质性的;例如,Kan2的表现通常与Kan几乎一样好。值得注意的是,图表未包含训练时间或收敛行为的信息。这些结果表明,至少对于这些任务和数据集,将KAN深度增加到一层或两层以上不会带来性能提升,甚至可能导致收益递减。
3.6 K复合波检测的比较性能分析
表总结了各种K复合波检测方法的性能,加粗值代表每列指标中的最优值。我们的TCN-KAN模型实现了有竞争力的准确率和特异性,表明与先前方法相比,其具有强大的判别能力和低假阳性率。
与其他在同一数据集上评估的方法相比,所提出的TCN-KAN网络在获得高准确率和灵敏度的同时,实现了卓越的特异性。因此,它成为K复合波分类最先进的方法之一。
3.7 基于波形计数的睡眠分期结果
在成功使用TCN-KAN模型检测EEG数据中的K复合波和纺锤波之后,我们基于不同睡眠阶段的特征进行了睡眠分期。
首先,我们使用DREAMS数据集进行了三分类测试。以5秒为间隔在数据集中计数特征波形。本实验中,使用一致的标准计算波形数量,并对数据进行分段,总共产生360个段。选择前320个段来分析睡眠分期结果。使用基于阈值的分类方法,结果如图所示。实验证明,特征波形的数量可以作为睡眠分期的依据。我们的分类结果与数据集中提供的参考标签相比,准确率分别达到79.7%(DREAMS-K复合波数据集)和68.4%(DREAMS-纺锤波数据集)。因此,使用K复合波和纺锤波区分睡眠阶段是一种可行的方法。
接下来,我们使用相同方法在更新的、具有五类标签的HMC数据集上进行了五阶段分类测试。我们在睡眠阶段分类中达到了81.6%的准确率;结果如图所示。这一结果证明了我们的方法在五阶段分类方案中识别睡眠阶段的成功应用。
4 讨论
4.1 KAN架构的优势
KAN层具有独特的优势。它将可学习的激活函数放在边上,这些一维激活函数被参数化为样条曲线。这使得模型能够动态调整以适应输入数据,显著增强了其灵活性、表达能力和可解释性。神经元的作用被简化为求和所有连接边的输出。连接通过其可学习的激活函数,负责捕获和表示更复杂的关系,从而在信息传输过程中实现灵活的非线性变换。
在数据拟合和偏微分方程求解等任务中,KAN层可以达到与全连接层相当或更高的准确率,同时使用更少的参数。这降低了传统全连接层因参数过多而导致的过拟合风险,并减少了计算成本和存储需求。
4.2 TCN-KAN混合模型的性能分析
本研究使用TCN-KAN的神经网络结构检测EEG信号中的K复合波。一系列性能指标的比较表明,这种网络结构对于K复合波的检测非常有效。该算法的准确率和灵敏度是报道中最高的之一,其特异性和MCC与先前方法相比是最高的。本研究表明,KAN层对时间序列数据的分类具有积极影响,用KAN层替换线性层可以提高算法性能。除灵敏度外,所有其他指标均提高了1%–2%。这一结果可能与TCN和KAN之间的互补相互作用有关:TCN擅长捕获时间序列数据中的局部特征和短期依赖关系,而KAN在处理高维和非线性特征数据方面表现良好,能够以改进的可解释性准确提取复杂模式。两种方法的结合效应使算法能够准确检测特征波形。
4.3 KAN层深度对模型性能的影响
研究揭示,堆叠多个KAN层并未改善算法性能,这有几个关键原因。
首先,随着层数增加,模型复杂度显著增长,发生了过拟合。因此,多个KAN层倾向于过拟合训练数据中的噪声和细节,这通常导致强大的训练性能但测试数据上的效果降低。
其次,每个额外的KAN层引入了大量新参数。然而,没有足够的训练数据,这些参数无法有效学习,进一步增加了过拟合的风险。
此外,在特征提取过程中,冗余和噪声放大变得显著。具体而言,多个KAN层经常重复提取相似的特征,而没有整合或推导出更有价值的信息。而且,每一层都有可能引入噪声,堆叠几层会随着时间的推移逐渐放大这种噪声。
4.4 睡眠分期分类
鉴于K复合波和睡眠纺锤波的计数和相对比例表现出显著的睡眠阶段特异性,本研究探索了一种基于这两种特征波形的自动睡眠分期方法,旨在评估睡眠深度。初步结果表明,对于三阶段分期任务,在DREAMS数据集上分别达到了79.7%(K复合波数据集)和68.4%(纺锤波数据集)的准确率,而对于五阶段分期任务,在HMC数据集上达到了81.6%的准确率,初步验证了该方法的可行性。该方法为开发可解释、低计算成本的辅助睡眠分析工具提供了一条有价值的探索路径。然而,由于当前数据集规模的限制,本研究未采用深度学习模型,这在一定程度上制约了分类性能的提升。此外,当前方法在分期过程中未纳入更广泛的互补性EEG特征,如频带功率或波形形态参数。通过进一步整合多维特征并搭配更强大但仍可解释的分类器,将有可能开发出更稳健、准确的睡眠分期系统,从而更全面地捕捉每个睡眠阶段的复杂神经生理学特征。
4.5 临床验证的挑战
尽管我们的算法在测试中显示出积极结果,但在应用于临床之前必须解决几个重大挑战。首先,必须提高算法的性能。虽然它能以93.18%的准确率检测K复合波,但其在纺锤波检测方面的性能并非最优,这可能影响临床解读的可靠性。其次,显著的个体差异是一个主要问题。数据来自有限数量的参与者;在实际临床场景中,每位患者的独特特征可能导致结果的显著变异性。需要在更多数据上进行测试以证明我们模型在不同参与者中的普适性。最后,系统兼容性仍然是一个挑战。
5 结论
本研究提出了一种基于TCN的KAN架构,在DREAMS数据集上对K复合波和纺锤波的检测准确率分别达到93.18%和86.26%。与TCN模型相比,添加KAN层使检测性能提升1%–2%,证明KAN架构作为一种新的神经网络结构,对于时域信号分类是有效的。我们进一步检验了使用多层KAN层的情况,发现堆叠更多层并不能提高网络性能。基于K复合波和纺锤波的检测结果,我们研究了仅使用特征性EEG波形进行睡眠分期的性能,发现结果表明可以利用睡眠EEG特征进行分期。在三阶段睡眠分类任务中,我们在DREAMS数据集上取得了79.7%(K复合波数据集)和68.4%(纺锤波数据集)的准确率。对于五阶段睡眠分类任务,我们在HMC数据集上取得了81.6%的准确率。这些结果证明了将可解释的、特征驱动的分期方法与高性能深度学习检测器相结合的可行性,为高效且临床透明的睡眠分析工具提供了一条潜在路径。