基于可解释CNN-LSTM框架的多类别神经肌肉障碍EMG分类新方法
《IEEE Transactions on Artificial Intelligence》:Interpretable CNN-LSTM Framework for Multiclass Neuromuscular Disorder Classification Using Clinically Relevant EMG Features
【字体:
大
中
小
】
时间:2025年12月08日
来源:IEEE Transactions on Artificial Intelligence CS6.4
编辑推荐:
本研究针对神经肌肉障碍(NMDs)诊断中存在的信号模式重叠、患者间变异大及传统模型可解释性差等挑战,提出了一种结合临床相关EMG特征的可解释深度学习框架。通过融合三种统计特征选择方法与临床验证描述符构建特征集,开发了能够同时捕捉EMG信号空间模式和时间动态的混合CNN-LSTM模型,并集成SHAP、LIME等多种可解释性技术。在多个数据集上的验证表明,该框架实现了95.83%的准确率和98.61%的AUC值,为中低收入地区提供了近实时诊断支持。
神经肌肉障碍(NMDs)是一组影响周围神经系统、骨骼肌或神经肌肉接头的复杂疾病,包括神经病变和肌病等常见类型。全球流行病学数据显示,NMDs年发病率高达122/10万,其中周围神经病变 alone 就影响7-8%的55岁以上成年人。早期准确诊断对治疗和康复至关重要,而肌电图(EMG)特别是肌内EMG(iEMG)一直是诊断NMDs的金标准。然而,传统EMG分析高度依赖专家经验,存在耗时长、主观性强、判读一致性差等问题。
尽管机器学习(ML)和深度学习(DL)方法已被广泛应用于EMG信号分析,但现有研究仍面临三大瓶颈:首先,多数模型基于单一中心的小规模数据集(通常每类少于25名受试者),限制了模型的泛化能力;其次,现有方法多局限于二分类任务,难以应对真实临床环境中多类别诊断需求;最重要的是,大多数模型缺乏可解释性机制,被视为"黑箱",导致临床医生难以信任其预测结果。此外,特征选择过程往往忽视临床知识指导,且缺乏跨数据集验证,进一步制约了临床转化潜力。
为突破这些局限,来自孟加拉国军事工程技术大学、达福迪尔国际大学等多个研究机构的研究团队在《IEEE Transactions on Artificial Intelligence》上发表了创新性研究成果。他们开发了一种结合临床洞察与可解释人工智能(XAI)技术的多类别NMD分类框架,通过融合数据驱动特征选择和临床经验验证,构建了兼具高精度和透明决策过程的诊断系统。
研究团队采用三项核心技术方法实现这一目标:首先建立多阶段信号预处理流程,包括下采样至4,096 Hz、10 Hz高通滤波和Daubechies-6小波去噪,确保信号质量的同时降低计算复杂度;接着从时域、频域、时频域和非线性特征四个维度提取28个临床相关EMG特征,并采用分布感知归一化策略(Min-max缩放、Z-score标准化和Robust缩放)处理不同尺度特征;最后通过集成三种统计特征选择方法(Fisher Score、递归特征消除和信息增益)与临床知识验证,形成最终特征集(FSF),并利用SMOTE技术解决类别不平衡问题。
模型架构设计体现创新思维,研究团队开发了混合CNN-LSTM网络,其中卷积层专门捕捉局部空间模式,LSTM层学习长期时间依赖关系。该架构包含两个卷积块(各含128个滤波器、核大小5),后接128单元LSTM层和32单元全连接层,最终通过Softmax输出三分类概率。特别值得注意的是,模型引入LeakyReLU(α=0.3)激活函数、批量归一化和Dropout(0.2)等正则化技术,共包含219,395个可训练参数,每个样本推理延迟中位数仅为59.56毫秒。
在性能验证方面,研究团队采用多维度评估策略。主要基于Mendeley数据集(241名受试者)进行模型训练与测试,同时使用EMGLAB数据集(23名受试者)进行跨人群验证,并利用私有表面EMG(sEMG)队列(40名受试者)进行外部跨模态测试。这种严谨的验证设计确保了模型评估的全面性和可靠性。
特征选择结果显示,最终特征集(FSF)包含15个关键特征,其中最大小波系数(MWC)、斜率符号变化(SSC)和小波熵(WE)等非线性特征贡献最为显著。通过普通最小二乘(OLS)回归分析证实,所有选定特征均呈现显著统计学意义(p<0.05),证明其特征选择的稳健性。
模型性能比较表明,CNN-LSTM框架在FSF特征集上表现最优,准确率达95.83%,显著优于传统机器学习模型(支持向量机85.50%、随机森林87.50%)和单一深度学习模型(CNN 82.50%、LSTM 83.33%)。其他关键指标同样出色:精确度95.85%、召回率95.83%、F1分数95.83%、Cohen's kappa 93.75%、马修斯相关系数(MCC)93.82%,曲线下面积(AUC)达98.61%。特别值得注意的是,模型在保持高精度的同时实现了59.56毫秒的推理速度,满足近实时临床应用需求。
消融实验深入解析了架构组件的贡献。移除第二个卷积层或批量归一化分别导致准确率下降至80.00%和80.83%,证明多层级特征提取和训练稳定性的重要性。单独使用CNN或LSTM模型性能均低于混合架构,验证了空间-时间联合建模的优势。优化器比较显示Adam表现最佳(准确率95.83%),显著优于Adagrad(80.00%)和SGD(80.83%)。学习率敏感度分析确定0.001为最优值,偏离该值会导致性能下降。
可解释性分析是本研究的重要亮点。通过SHAP(SHapley Additive exPlanations)分析发现,MWC、SSC和WE是影响分类决策的三大关键特征。局部可解释性模型(LIME)分析揭示了特征与临床表型的对应关系:神经病变预测与高MWC(>0.52)、高HA(Hjorth Activity,>0.20)相关,反映信号复杂性和不规则放电;健康状态与低SSC(≤-0.36)、低WAMP(Willison Amplitude,≤0.05)相关,表征信号稳定性;肌病则表现为中等范围SSC(-0.28至0.81)和WE(0.32至0.82),符合部分肌纤维损失的生理特征。部分依赖图(PDP)进一步验证了特征与类别概率间的非线性关系,如SD(标准差)低于0.2时健康概率高,高于0.5时肌病概率增加。
跨数据集验证结果彰显模型的强泛化能力。在EMGLAB数据集上准确率达91.47%,私有sEMG队列上达90.00%,表明模型能够适应不同采集设备和人群特征。虽然表面EMG信号特性与肌内EMG存在差异,但模型仍保持优异性能,证明其特征表示能力的鲁棒性。
基于这些成果,研究团队设计了临床决策支持系统原型,集成模型预测与LIME解释功能。当输入新EMG信号时,系统不仅输出诊断结果,还提供特征级决策依据,如"高MWC(0.62)支持神经病变诊断",使临床医生能够理解模型推理过程,增强对AI辅助诊断的信任度。
本研究在多方面实现重要突破:首次将完整可解释AI技术套件应用于多类别NMD分类,克服了传统黑箱模型局限;通过融合统计特征选择和临床知识验证,构建了生理意义明确的特征集;验证策略严谨,涵盖跨人群和跨模态测试,为临床转化奠定基础。特别是针对资源有限地区的应用场景,模型59.56毫秒的推理速度使其具备现场部署潜力,有望改善神经肌肉疾病诊断可及性。
当然,研究也存在一定局限性,如总样本量相对有限,未来需要通过多中心合作扩大数据规模;当前框架主要针对三种常见NMD类型,未来可扩展至更多疾病亚型。此外,尽管进行外部验证,但前瞻性临床评估仍需加强。
这项研究为EMG信号分析领域贡献了重要方法论创新,通过可解释深度学习框架成功平衡了模型性能与临床可接受性,为AI在神经肌肉疾病诊断中的实际应用提供了范例。其技术路径不仅适用于NMD领域,对其他生理信号分析任务同样具有参考价值,标志着可解释AI在关键医疗应用中的重要进展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号