首个包含空间分布信息的中国人群癫痫样放电公开脑电数据集发布

【字体: 时间:2025年02月08日 来源:Scientific Data 5.8

编辑推荐:

  本研究针对癫痫诊断中脑电图(EEG)间期癫痫样放电(IED)检测的临床挑战,由中国医学科学院北京协和医院团队构建了包含84例患者28小时EEG的公开数据集。该数据集创新性标注了IED的空间分布(广泛性/额叶/颞叶/顶枕叶/中央区)和意识状态(清醒/睡眠),并基于VGGEEG模型验证了其提升IED检测精度的价值(灵敏度80%时特异性达97%),为癫痫精准诊疗提供了重要数据资源。

  

癫痫诊疗的"读图困境"与破局之道

癫痫影响着全球超5000万患者,而脑电图(EEG)中瞬现的间期癫痫样放电(IED)是其诊断金标准。然而临床实践中,IED识别高度依赖经验丰富的医师肉眼判读,不仅耗时费力,更因IED形态的多样性和伪迹干扰导致误诊率居高不下。尽管深度学习(DL)为自动化IED检测带来曙光,但现有公开数据集普遍存在样本量小(6-30例)、缺乏空间定位信息等缺陷,严重制约了算法研发。更关键的是,癫痫作为脑网络异常疾病,IED的空间分布特征对癫痫分类、用药指导和术前评估具有决定性价值,但主流数据集如TUH-EEG Corpus均未包含这类信息。

中国医学科学院北京协和医院神经内科团队在《Scientific Data》发表了迄今最全面的IED专项数据集。研究者收集了84例中国癫痫患者(含52例IED阳性)的20分钟连续EEG数据,采用19导联10-20系统采集,经0.1-70Hz滤波和50Hz工频陷波预处理。创新性地由3名EEG专家联合标注了2516段IED事件(4秒/段),并按发生区域分为广泛性、额叶、颞叶、顶枕叶和中央区5类,同时标注意识状态(清醒/睡眠)。数据集包含22833段阴性样本,真实模拟临床EEG中IED的低占比(9.9%)场景。

关键技术方法

研究采用500Hz采样率的Nihon Kohden EEG-1200C设备采集数据,经SciPy工具箱进行带通滤波和陷波滤波。通过Neuro Workbench软件实现0.002秒精度的IED标注,采用五折交叉验证训练VGG18网络,并创新性地将意识状态通过多层感知机(MLP)编码为24维特征向量,构建VGGsleep改进模型。

主要研究发现

  1. 模型验证结果

    VGGEEG基线模型在80%灵敏度下达到74.2%精度和97%特异性。融入意识状态的VGGsleep模型显著提升性能,AUPRC从0.8585提升至0.8718,90%灵敏度时精度提高近10个百分点(60.0% vs 50.4%),证实睡眠-清醒状态信息可有效区分生理波与IED。

  1. 空间分类效能

    五折交叉验证显示,VGG对中央区IED识别最佳(灵敏度95.1%,精度93.5%),颞叶IED次之(灵敏度89.9%),额叶IED因肌电干扰表现稍弱(灵敏度71.8%)。广泛性IED与局灶性IED的混淆主要发生在额叶扩散病例中。

  2. 临床实用性验证

    采用独立训练的vEpiNet模型测试本数据集,在80%灵敏度下取得63.6%精度(与前瞻性临床研究结果一致),证实数据集能真实反映临床环境的数据分布特征。

研究启示与展望

该研究创建了首个包含IED空间分布和意识状态信息的中国人脑电数据集,其价值体现在三方面:首先,28小时高质量标注数据填补了现有公开数据集在样本量和维度完整性上的空白;其次,证实空间分布和意识状态信息可提升DL模型性能,为开发新一代癫痫辅助诊断系统指明方向;最后,严格模拟临床场景的数据结构(低IED占比、包含运动伪迹)使其成为算法临床转化的理想测试平台。

值得注意的是,数据集捕捉到中国癫痫人群的独特特征——如颞叶IED占比最高(34.1%),与西方人群以额叶IED为主的分布存在差异,这为开展种族差异性研究提供了可能。未来研究可进一步结合功能影像数据,探索IED空间分布与致痫网络的内在关联。数据集已开源(Figshare DOI:10.6084/m9.figshare.28069568),配套代码发布于GitHub,将有力推动癫痫精准医疗的全球协作创新。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号