《Biomedical Signal Processing and Control》:A fuzzy deep learning ECG signal classification method via Wavelet-RL and rough set decision-making
编辑推荐:
ECG信号分类面临噪声、时间非平稳性和类边界模糊的挑战,本文提出WR-FuzzyCNN框架,集成小波-强化学习去噪、模糊C均值池化特征提取和决策理论粗糙集分类,在MIT-BIH数据集上达到98.58%的准确率。
Xiao-li Wang | Cheng-hai He | Ying Feng | Qi Feng
电子与信息学院,广东工程技术师范大学,广州,510660,中国
摘要
心电图(ECG)信号分类仍然受到非平稳噪声、时间模糊性和类边界模糊等挑战的阻碍。为了解决这些问题,我们提出了一种名为“小波强化学习增强型模糊卷积神经网络(WR-FuzzyCNN)”的新框架,该框架整合了基于小波的自适应去噪、模糊特征建模和粗糙集决策方法。首先,设计了一种自适应小波强化学习(Wavelet-RL)策略,结合多尺度小波分解和强化学习,动态调整阈值参数,有效抑制各种类型的噪声。其次,引入了模糊C均值池化机制,允许数据段以不同的隶属度参与多个簇,从而捕捉局部模糊性和过渡模式,提高模型区分模糊信号片段的能力。此外,基于粗糙集的机制定义了三种决策域——接受、拒绝和暂缓——以明确表达不确定性并提高决策可靠性。最后,在MIT-BIH心律失常数据库上进行的广泛实验使用四折交叉验证证实了WR-FuzzyCNN的有效性,其分类准确率达到98.58%,优于现有的基线方法。
引言
心电图(ECG)信号记录了心脏随时间变化的电活动,广泛用于心脏疾病的诊断和监测。作为一种无创且成本效益高的诊断工具,ECG提供了检测心律失常的重要信息——心律失常可能表明严重的心血管疾病。因此,准确解读ECG信号对于早期诊断和及时临床干预至关重要,尤其是考虑到心血管疾病仍然是全球主要的死亡原因。
近年来,人工智能(AI)通过实现自动化和高通量心律失常检测,彻底改变了ECG分析。深度学习(DL)技术在从ECG信号中提取具有区分性的形态和时间特征方面表现出色,促进了准确的心跳分类和节律诊断[1]。然而,可靠的ECG分类仍然具有高度挑战性。实际ECG记录常常受到基线漂移、电力线干扰和运动伪影的污染,这些因素会掩盖具有临床意义的波形。此外,不同心律失常之间的形态相似性导致类边界模糊,而不确定或过渡性的心脏模式则引入了模型决策的不确定性。这些问题共同影响了基于AI的ECG分析的鲁棒性、泛化能力和可解释性。
为了解决这些挑战,开发了一个统一的模糊深度学习框架——小波强化学习增强型模糊卷积神经网络(WR-FuzzyCNN),将自适应去噪、模糊特征提取和不确定性感知的决策推理集成到一个连贯的架构中。如图1所示,WR-FuzzyCNN的设计通过三项主要创新实现了鲁棒且可解释的ECG分类:
小波强化学习(Wavelet-RL)自适应去噪:通过将强化学习(RL)嵌入小波变换(WT)中,建立了一种自适应去噪机制。Wavelet-RL模块根据信号质量反馈动态调整多尺度阈值参数,实现智能的、考虑噪声的去噪效果。据我们所知,这是首次将RL引导的小波阈值应用于ECG增强。
基于模糊C均值(FCM)的深度模糊学习模块与池化:通过将基于模糊C均值(FCM)的池化方法嵌入卷积神经网络(CNN),开发了一种深度模糊表示框架。提出的FCM-Pooling层在局部特征区域内进行软聚类分配,使每个数据段能够贡献于多个模糊簇。通过建模局部不确定性和过渡性心脏形态,该机制提高了类间模糊情况下的特征区分能力。
混合模糊-粗糙推理与决策理论粗糙集(DTRS):为了明确管理决策不确定性,结合了基于决策理论粗糙集(DTRS)的混合模糊-粗糙推理机制。通过定义三种决策域——接受、拒绝和暂缓——DTRS模块实现了风险意识和可解释的分类推理,提高了临床决策支持的可靠性。
从临床角度来看,WR-FuzzyCNN框架在分类准确性和计算效率之间取得了良好的平衡,适用于实时和资源受限的应用场景,如床边监测和可穿戴ECG系统。模糊和粗糙推理机制的集成进一步通过将算法结果与生理意义上的ECG模式联系起来,增强了可解释性。
相关工作
相关研究
近年来,深度学习技术在ECG去噪和分类方面取得了显著进展。例如,Yang等人[2]使用卷积神经网络(CNN)进行噪声抑制,尽管他们的方法在实际噪声变化下的鲁棒性有限。为了捕捉时间依赖性,Mostayed等人[3]引入了双向长短期记忆(BiLSTM)网络;然而,其性能仍然依赖于手动调整
公共ECG数据集
MIT-BIH心律失常数据库[13]是主要的数据来源。该数据库由麻省理工学院和Beth Israel医院共同开发,是心电图(ECG)信号分析和心律失常检测的公认基准。该数据库包含48份半小时的双导联动态ECG记录,每份记录来自不同的受试者,采样率为360 Hz,分辨率为11位,测量范围为10 mV。所有注释均由专家手动验证
性能验证
结果基于定义的评估指标进行报告。所有实验均在配备Intel(R) Core(TM) i7-11700处理器、NVIDIA GeForce GTX 1660 SUPER GPU、32 GB RAM、64位Windows 10操作系统和PyTorch 3.9版本的计算平台上进行。
讨论
传统的深度学习模型在ECG分类方面表现出色,特别是在捕捉时间和形态模式方面。长短期记忆(LSTM)网络[43]有效建模了序列依赖性,心室搏动分类的准确率达到90.84%,宏观F1分数为94.5%。一维卷积神经网络(1D-CNN)框架[44]增强了形态特征表示,总体准确率达到96.80%。混合
结论
提出了一种名为WR-FuzzyCNN的新模糊深度学习框架。它无缝整合了基于小波强化学习(Wavelet-RL)的自适应去噪、FCMPooling驱动的模糊特征表示和DTRS引导的决策分类。该框架专门设计用于在噪声较大和不确定性较高的条件下增强ECG信号分析,有效解决了形态模糊性、时间非平稳性和决策边界不确定性等关键问题。
在
CRediT作者贡献声明
Xiao-li Wang:撰写——审稿与编辑、验证、监督、项目管理、方法论、研究、资金获取、形式分析、概念化。Cheng-hai He:撰写——审稿与编辑、初稿撰写、可视化、验证、软件开发、研究、数据管理。Ying Feng:监督、形式分析。Qi Feng:撰写——审稿与编辑、验证、监督。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
本工作得到了中国广东省基础与应用基础研究基金[编号:2021A1515110078];广东工程技术师范大学的人才引进项目[编号:2022SDKYA002];机器学习示范课程开发项目[2024XJSFKC010];以及现代信号处理技术教学案例库建设项目[2025XJANLK004]的支持。