《Physical and Engineering Sciences in Medicine》:Compact neural network algorithm for electrocardiogram classification
编辑推荐:
本文提出了一种高效、紧凑的心电图(ECG)分类算法,用于心律失常诊断,旨在应对当前ECG分析对深度学习和卷积神经网络(CNN)方法的依赖。该研究致力于降低对深度学习的需求,因为深度学习通常需要大量计算资源和大规模标注数据集。研究人员的方法引入了一种具有简单结构
本文提出了一种高效、紧凑的心电图(ECG)分类算法,用于心律失常诊断,旨在应对当前ECG分析对深度学习和卷积神经网络(CNN)方法的依赖。该研究致力于降低对深度学习的需求,因为深度学习通常需要大量计算资源和大规模标注数据集。研究人员的方法引入了一种具有简单结构的人工神经网络(ANN),并结合一条紧凑且可解释的特征工程流程。该研究的一项关键贡献在于引入了17个人工构建特征,用以从原始ECG信号中提取关键模式。通过整合数学变换、信号处理方法与数据提取算法,该模型能够高效捕获ECG信号的形态学与生理学特征,而无需依赖深度学习。该方法在五类心律分类任务中表现出与其他先进模型相近的性能,这五类包括窦性正常心律、窦性心动过缓、窦性心动过速、心室扑动和心房颤动。该算法在MIT-BIH与St. Petersburg INCART心律失常数据库上的准确率达到 \(96.48\% \pm 2.50\%\),Cohen’s kappa为 \(0.9546 \pm 0.0321\),Matthews相关系数为 \(0.9557 \pm 0.0313\)。该模型的紧凑性以及其在标准中央处理器(CPU)上的低推理延迟表明,该方法有望成为部署于资源受限平台的候选方案。
该论文发表于《Physical and Engineering Sciences in Medicine》,围绕心电图(ECG,electrocardiogram)心律失常自动分类中的“高性能”与“低复杂度”之间的矛盾展开研究。研究背景在于,心律失常是由调控心跳的电活动异常所引起的一类疾病,部分类型可直接危及生命,而ECG作为无创、标准化、临床普遍使用的心脏电活动检测工具,在心血管疾病筛查和诊断中具有核心地位。然而,传统ECG判读高度依赖临床医师经验,易受噪声、节律间相似性以及同类疾病异质性影响;另一方面,当前自动分析研究虽然大量采用深度学习,尤其是卷积神经网络(CNN),能够减少人工特征设计,但通常依赖大样本标注数据和较高算力,限制了在便携式设备和资源受限场景中的实际部署。正是在这一问题背景下,研究人员开展本研究,试图以较小模型结构结合高信息密度特征工程,构建一种兼顾可解释性、准确性和计算效率的ECG分类方法。
研究人员提出了一种基于紧凑型人工神经网络(ANN)的五分类框架,用于识别窦性正常心律(NSR)、窦性心动过缓、窦性心动过速、心室扑动(VF)和心房颤动(AF)。论文的核心创新主要体现在三个方面:其一,构建了一个17维异质特征描述符,将统计学特征、形态学特征、频谱特征、解析信号特征以及主成分分析(PCA,principal component analysis)特征融合于同一原始ECG信号中,以向分类器提供互补性的心脏动力学表征;其二,将网络结构刻意约束为仅含单隐层、且隐层只有5个神经元的浅层网络,使可训练参数总数仅为154个,显著低于文中对比的卷积类模型;其三,在训练过程中引入类别加权,以缓解数据集中VF样本占比较低造成的类别不平衡,而未采用合成数据增强。这一设计使模型在保持极低复杂度的同时,达到 \(96.48\%\) 的总体分类准确率,显示出较优的准确率—效率平衡。
研究所采用的主要技术方法可概括如下:研究样本来自PhysioNet平台的MIT-BIH Arrhythmia Database与St. Petersburg INCART 12-lead Arrhythmia Database,最终纳入单导联Lead I信号,构建包含5类节律的5 s片段样本集。信号预处理包括将MIT-BIH数据降采样至257 Hz、分割为5 s片段、采用窗口为12的移动平均进行平滑去噪,并经最小-最大缩放归一化。特征提取方面,研究人员整合4个统计矩、3个峰值/心率相关指标、3个PCA主成分、2个离散傅里叶变换(DFT)派生统计量、3个Hilbert包络特征及Shannon熵等,共17个特征。分类器采用含批量归一化(BN,batch normalization)的单隐层ANN,并在分层10折交叉验证重复5次的框架下评估性能。
在研究结果部分,论文首先通过总体混淆矩阵与多项评价指标证明了该紧凑模型的有效性。研究人员将50个互不重叠测试折的预测结果汇总,得到全局混淆矩阵,并报告模型平均准确率为 \(96.48\% \pm 2.50\%\)。考虑到类别不平衡,尤其是VF仅占 \(5.6\%\) 的样本比例,研究进一步给出 Cohen’s kappa(\(\kappa\))和Matthews相关系数(MCC),分别达到 \(0.9546 \pm 0.0321\) 与 \(0.9557 \pm 0.0313\),同时宏平均F
1值为 \(0.9586 \pm 0.0347\),宏平均精确率和召回率分别为 \(0.9632 \pm 0.0337\) 与 \(0.9628 \pm 0.0319\)。这些结果表明,所提特征向量能够为心律失常检测提供稳定、全面且具有判别力的信息来源,模型性能并非仅由多数类驱动,而是在五个类别上均表现出可靠区分能力。
在“Hyperparameter sensitivity and feature ablation”部分,研究人员对隐层神经元数目进行了敏感性分析,并对不同特征家族的重要性进行了消融评估。结果显示,在 \(\{2, 3, 5, 8, 12, 20, 40\}\) 个隐层单元中,测试准确率在5个神经元处趋于平台,继续增加神经元数量并未带来具有统计学意义的性能提升,却会增加参数规模,因此最终选择5神经元作为满足“紧凑性”目标的最小平台配置。特征消融结果则显示,峰值/心率描述符对模型贡献最大,移除后准确率下降约10个百分点;统计矩次之,移除后约下降2个百分点;而PCA、DFT、Hilbert包络与Shannon熵特征在其他特征存在时仅表现为边际增益。这说明该17维特征向量的价值并不在于单一复杂特征,而在于多源异质信息的互补整合。
在“Feature engineering”部分,论文系统说明了17项特征的构成及其作用机制。研究强调,这些特征本身并非新提出的方法,而是已有ECG研究中较为成熟的描述符;本文的贡献在于证明,经过精心筛选和组合的低维复合特征,足以驱动一个仅有5个隐层神经元的浅层网络,达到与更深层卷积网络相当的分类性能。具体而言,统计矩包括均值、峰度、偏度和方差,用于刻画信号分布形态和动力学变化;临床相关特征包括心率、峰值振幅变异性以及峰间平均距离,用于反映节律规则性和搏动频率;PCA保留前3个主成分,在训练折中平均解释 \(72.34\% \pm 0.15\%\) 的平滑ECG方差;DFT将时域信号映射到频域,并从变换结果中提取偏度和峰度;Hilbert变换生成包络函数,并进一步提取均值、最小振幅与最大振幅;Shannon熵则用于量化信号复杂性,尤其与AF识别相关。这些特征共同构成一个覆盖时域、频域、统计域及节律域的综合表示。
在“Computational efficiency”部分,论文进一步从计算负担角度验证模型的实际部署潜力。研究人员量化了网络结构的参数构成:BN层有34个可训练参数,5神经元隐层有90个,softmax输出层有30个,共计154个可训练参数,另有34个BN非可训练参数用于存储运行统计量。在无GPU加速的Intel Core i7 CPU上,完整训练一次(220个epoch,batch size为20)平均耗时9.33 s,而单个5 s ECG片段的推理时间为1.014 ms,特征提取阶段额外增加1.937 ms,总端到端时延约3 ms。该结果表明,该方法满足嵌入式生物信号处理器常见的毫秒级预算要求,因而适合低功耗、资源受限的移动健康应用场景。
在“Results”与相关比较分析中,研究人员将该模型与多种已有方法进行对照,指出其性能与先进模型相当。文中提到,基于小波变换特征的神经网络模型准确率可达96.48%,与本文结果一致;某些复杂12层CNN模型达到97.8%,残差1-D CNN可达98.63%,但这些模型需要高得多的参数规模和计算成本。与之相比,本文模型以极低参数量获得相近准确率,呈现出更优的工程可部署性。研究同时指出,由于不同研究在数据集、采样率、片段长度、类别定义和评估协议上存在明显差异,因此这些对比仅用于定位本文方法在相关研究谱系中的性能区间,而非严格意义上的同条件头对头比较。
在“Discussion”部分,论文对模型行为、优势及局限性进行了审慎总结。混淆矩阵显示,NSR和AF的召回率接近完美,VF尽管样本最少,但召回率仍达到0.94,已可与大类相比。残余误差主要集中在窦性心动过缓与窦性心动过速之间,原因在于二者除心率特征外存在较高形态相似性。类别平衡加权虽然在一定程度上缓解了VF的类别失衡问题,但尚不能完全消除窦性节律类别之间的混淆。研究人员指出,若未来能补充更多位于60 bpm或100 bpm阈值附近的边界病例样本,模型性能可能进一步提升。讨论还强调,峰值/心率描述符和统计矩的主导作用,与所研究心律失常主要由心率变化和连续搏动规则性改变所定义的临床事实一致,而其余特征家族则提供了频谱、时频和统计背景信息,使得极小型分类器仍能达到较高性能。
论文同时明确指出其局限性:数据仅来源于两个PhysioNet数据库,且只使用单导联Lead I,尚未评估对多导联记录、动态监测数据及更广泛患者群体的泛化能力;训练样本均为持续性心律失常模式的5 s片段,这与临床环境中更嘈杂、更多瞬态事件的真实场景仍有差距;与文献方法的比较受限于实验条件异质性,不能据此声称严格优越性。此外,作者强调该模型目前应被视为概念验证原型(proof-of-concept prototype),而非经临床验证的诊断工具。关于实时部署的结论目前仅基于桌面CPU上的推理时延,尚未在真实嵌入式硬件或临床流程中完成验证。未来若要进入临床应用,还需开展独立多中心队列前瞻性验证、真实噪声条件下评估,以及对人口学和病理异质性的鲁棒性检验。
研究结论部分可译为:该研究通过ECG信号分析与机器学习算法,对心律失常研究作出了重要贡献。研究结果表明,紧凑型神经网络可作为一种稳健的、基于机器学习的ECG分类方案。所提出神经网络结构的简洁性使其软件实现较为直接,有利于集成至不同医疗场景,尤其是技术资源有限的环境。除神经网络模型本身外,所提出的特征工程技术还能够从ECG信号中提取相关且复杂的信息。该模型的性能与当前先进算法相当。研究人员据此倡导进一步探索特征工程,将其作为开发更简单、更易获得且更稳健的心律失常检测与分类机器学习方案的有效策略。