
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多中心前瞻性研究验证视频-脑电图多模态自动检测模型在癫痫样放电识别中的临床应用价值
【字体: 大 中 小 】 时间:2025年08月17日 来源:BMC Medicine 8.3
编辑推荐:
本研究针对癫痫诊断中视觉识别癫痫样放电(IED)存在专家偏差且耗时的问题,开发了基于深度学习的视频-脑电图(EEG)多模态自动检测模型vEpiNetV2。研究人员通过整合视频运动特征与EEG信号,结合创新的坏道去除算法(YOLOv5-PatientV2),在包含530名患者的训练集上构建模型,并在三家医疗中心(北京协和医院、山东大学附属儿童医院、北京天坛医院)的149名患者中进行前瞻性验证。结果显示,模型在三个中心的AUPRC达0.76-0.78,AUC达0.96-0.98,视频特征使假阳性率降低24%,证实了多模态方法在真实临床场景中的稳健性。
癫痫作为全球约5000万患者受累的神经系统疾病,其诊断金标准——脑电图(EEG)中癫痫样放电(IED)的识别长期依赖人工判读。这不仅导致专家间判读差异(Kappa值仅0.4-0.6),面对日益增长的EEG监测时长(部分患者需连续监测72小时),视觉筛查更成为临床沉重负担。更棘手的是,EEG信号易受肌电伪迹、环境噪声干扰,而不同医疗中心的设备参数、电极布局差异(如T1/T2电极使用不规范)进一步增加了自动化检测的难度。
北京协和医院神经科团队联合网易媒体技术公司,在《BMC Medicine》发表了首个通过多中心前瞻性验证的多模态IED检测系统vEpiNetV2。该研究创新性地将患者视频动作捕捉与EEG分析相结合,开发了包含三大核心技术的方法体系:基于ResNet-18的坏道检测模块(识别准确率90.2%)、优化后的YOLOv5-PatientV2患者定位系统(mAP提升至92.47%),以及融合短时傅里叶变换(STFT)时频分析与EfficientNetV2的特征提取框架。研究从三家医院获取377小时原始视频-EEG数据,包含9232个IED事件,所有数据均经至少3名专家双重标注确认。
方法学突破
研究团队首先通过滑动窗口策略将EEG分割为4秒片段,经STFT转换为时频矩阵后,由深度网络提取1024维特征。同步视频数据通过帧差法和简单关键点(SKPS)系统量化患者动作,生成6维运动特征并扩展至128维。特别值得注意的是,针对多中心数据差异,团队构建了X3D_L分类器,证实三家医院的EEG幅值存在统计学差异(P<0.001),其中山东大学附属儿童医院因儿科患者居多呈现更高幅值(均值2.63μV vs 协和医院-6.47μV)。
核心发现
多中心验证性能:在80%灵敏度设定下,模型在协和医院、山东儿童医院和天坛医院的假阳性率分别为0.16、0.31、0.21次/分钟,精度达61.5%-66.9%。视频特征的引入使总体假阳性减少24%(95%灵敏度时),其中在天坛医院效果最显著(AUPRC提升0.09)。
技术组件贡献:
坏道检测模块有效消除未连接电极干扰(SDQLCH中心95.2%的坏道来自T1/T2电极)
患者定位系统的跨中心适配使BJTH中心mAP从63.5%提升至87.12%
视频运动特征对肌电伪迹的鉴别贡献率达9%(协和医院)
临床实用性指标:在包含21例全面性IED和86例局灶性IED的测试集中,模型对颞叶起源IED的检测灵敏度最高(AUPRC 0.81),而视频数据显著改善了对被褥遮盖肢体动作引发的假阳性识别。
这项研究首次系统论证了多模态方法在真实临床场景中的普适性。通过严格的跨中心验证,证实了视频-EEG融合策略可突破单一模态局限:在儿童患者居多的山东中心,尽管EEG幅值差异显著(ANOVA P<0.001),模型仍保持78%的AUPRC稳定性。研究者特别指出,未来需建立视频采集标准以进一步提升YOLOv5-PatientV2的泛化能力。该成果为癫痫的自动化筛查提供了新范式,其开源代码(GitHub可获取)将促进临床转化应用。正如讨论部分强调,这种分层检测策略——先区分全面/局灶性IED再针对性分析的思路,可能成为下一代IED检测系统的发展方向。
生物通微信公众号
知名企业招聘