基于深度学习的癫痫发作预测:决策级与特征级融合方法的对比研究
《Engineering Science and Technology, an International Journal》:Epileptic seizure prediction with deep learning-based fusion methods
【字体:
大
中
小
】
时间:2025年11月01日
来源:Engineering Science and Technology, an International Journal 5.1
编辑推荐:
本研究针对癫痫发作预测中单一模态表征能力有限的问题,系统比较了决策级与特征级两种深度学习融合策略。研究人员构建了分别处理原始脑电图(EEG)和短时傅里叶变换(STFT)时频图的双分支模型,在CHB-MIT数据集上采用分层5折交叉验证进行评估。结果显示,特征级融合模型达到97.70%准确率和98.62%特异性,决策级融合模型实现96.86%敏感度和0.99 AUC值。两种融合方法均显著优于单分支基线,温度缩放(Temperature Scaling)进一步改善了概率校准。该研究为临床癫痫预警系统提供了具有不同优势的融合方案选择。
当大脑神经元突发异常放电,癫痫发作便不期而至。全球约1%的人口深受这一神经系统疾病困扰,其中相当部分患者属于药物难治性癫痫,时刻面临着突发性发作带来的安全威胁和生活质量下降。传统脑电图(EEG)分析虽然能够捕捉大脑电活动模式,但人工判读耗时费力且存在主观差异,这使得开发可靠的自动化预警系统成为临床迫切需求。
近年来,基于机器学习和深度学习的方法为癫痫预测带来了新希望。然而,单一的数据表征方式——无论是原始EEG时间序列还是时频变换图谱——往往难以全面捕捉复杂的预发作(preictal)特征。如何有效融合不同表征的优势,构建既准确又可靠的预测模型,成为该领域的关键挑战。
在这项发表于《Engineering Science and Technology, an International Journal》的研究中,研究人员Atakan Da?demir和Humar Kahramanl? ?rnek开展了一项系统性的对比研究,旨在回答一个核心问题:在癫痫发作预测中,决策级融合(后期合并模型输出)与特征级融合(早期合并特征表示)哪种策略更具优势?他们设计了一个公平的协议控制比较框架,量化了两种融合策略在实际应用中的权衡。
研究团队采用了CHB-MIT公开儿科EEG数据集,通过严格的预处理流程确保数据一致性。他们构建了双分支架构:一个分支处理原始EEG信号,采用时序卷积网络(TCN)结合门控循环单元(GRU)和时序注意力机制;另一个分支处理STFT时频图,使用二维卷积神经网络(2D-CNN)结合GRU和时序注意力。两种融合策略在此基础上展开:决策级融合通过区间二型(IT2)模糊规则结合两个分支的后验概率;特征级融合则通过可学习的融合块合并两个分支的嵌入表示,再进行最终分类。
研究采用CHB-MIT数据集中的18个通道EEG信号,预处理包括带阻滤波(消除60Hz工频干扰)和高通滤波(1Hz截止频率)。将信号分割为5秒段,定义发作前30分钟为预发作期(SOP),发作前3分钟为预测视界(SPH)。使用分层5折交叉验证,每个患者的数据被分为5份,轮流取4份作为训练集,1份作为测试集。训练过程中采用混合精度、AdamW优化器和早停策略,评估指标包括准确率、敏感度、精确度、F1值、特异性、AUC、PR-AUC以及5%假阳性率下的敏感度(Sens@5%FPR)。
单一的时间序列分支(TCN→GRU+时序注意力)作为基线模型,在18名患者上的平均准确率为93.23%,敏感度为92.32%,假阳性率为5.57%,AUC为0.97。部分患者如Chb06和Chb17表现较差,准确率分别仅为79.34%和85.29%,假阳性率高达19.95%和14.58%,表明单一分支在召回率和误报控制方面存在改进空间。
两种融合策略均显著优于单分支基线。特征级融合模型实现了97.70%的准确率、96.63%的敏感度、98.47%的精确度、98.62%的特异性(假阳性率约1.38%)和0.99的AUC值。决策级融合模型达到97.50%的准确率、96.86%的敏感度、97.57%的精确度、97.43%的特异性(假阳性率约2.57%)和0.99的AUC值。与单分支相比,准确率提升约4.3-4.4个百分点,敏感度提升约4.2-4.5个百分点,假阳性率从5.57%降至1-2%左右(降低约3-5倍)。
特别值得注意的是,在困难案例中融合模型表现出显著优势。如患者Chb06,特征级融合将准确率从基线的79.34%提升至95.82%,假阳性率从19.95%降至2.53%;决策级融合也达到90.43%的准确率和10.90%的假阳性率。患者Chb17的假阳性率从基线的14.58%大幅降至特征级融合的0.07%和决策级融合的0.38%。
通过t-SNE可视化发现,特征级融合在患者Chb03上形成两个紧凑且重叠最小的簇,表明接近线性可分性;患者Chb09的类别边界虽略有 irregular,但仍保持清晰分离。决策级融合在患者Chb10上展现出干净的类别边界,与其接近完美的AUC值一致;患者Chb06虽存在一定重叠,但比单分支基线形成更一致的聚类结构,与观察到的召回率提升相符。
这项研究系统比较了两种深度学习融合策略在癫痫发作预测中的应用,为临床实践提供了明确的方法选择指南。特征级融合在降低假阳性率、提高精确度方面表现更优(平均FPR 1.30% vs. 2.18%),适合对误报敏感的应用场景如可穿戴设备;决策级融合在敏感度方面略有优势(96.86% vs. 96.52%),且具有更低的延迟和计算资源需求(3.821ms vs. 4.842ms每样本),适合对漏报风险敏感的场景如病房监护。
两种融合模型均实现了接近完美的AUC值(约0.99),表明它们能有效区分预发作期和发作间期脑电活动。温度缩放后校准指标(如NLL)的进一步改善,增强了模型输出概率的可靠性,为临床阈值设定提供了更可靠的依据。
该研究的临床意义在于:高敏感度(约96-97%)配合极低假阳性率(约1-2%)的平衡,结合毫秒级推理延迟,使得这两种融合策略都能支持在3分钟预测视界内的 proactive 干预。对于动态监护或病房监测而言,这种平衡——早期预警与有限警报负担的兼顾——对患者安全、护理工作量和患者焦虑管理都至关重要。
研究也存在一定局限性,如结果仅限于CHB-MIT数据集,需要跨数据集验证(如TUH、EPILEPSIAE)来评估泛化能力。未来工作方向包括跨数据集验证、多类别预发作分期、基于Transformer或自监督的预训练以进一步提升鲁棒性,以及可解释性技术的集成以增强临床信任度。
这项研究不仅提供了两种经过严格比较的融合方案,更重要的是明确了它们各自的应用场景和权衡关系,为癫痫预测领域的实际部署提供了实证依据,推动了深度学习在临床预警系统中的可靠应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号