编辑推荐:
为优化 ECG 分类模型性能,研究人员针对 ResNet 类模型,探究层深度、通道数、卷积核尺寸对分类效果的影响。发现较浅网络、更多通道和更小核表现更优,且 ECG 信号周期性是差异主因,为模型开发提供新方向。
在医疗人工智能领域,心电图(ECG)自动分类是一项关键且充满挑战的任务。随着深度学习技术的发展,基于卷积神经网络(CNN)的模型,尤其是残差网络(ResNet),在 ECG 分类中展现出一定潜力,但如何优化网络结构参数以提升模型效率和准确性,一直是困扰研究者的难题。传统计算机视觉领域中,更深的网络层、更大的卷积核尺寸往往能提升模型性能,但 ECG 信号具有独特的周期性和时序特征,直接套用计算机视觉的经验可能并不适用。因此,探索适合 ECG 分类的神经网络缩放策略,对于开发高效的医疗诊断模型至关重要。
为解决这一问题,相关研究人员开展了针对 ResNet 类模型在 ECG 分类中网络缩放参数影响的系统性研究。该研究以 Physionet2021 和 Alibaba 天池竞赛数据集为基础,深入分析了层深度、通道数和卷积核尺寸对模型性能的影响机制,旨在为 ECG 分类模型的优化提供理论依据和实践指导。研究成果发表在《Informatics in Medicine Unlocked》。
研究人员主要采用以下关键技术方法:首先,构建基于 ResNet 的一维卷积神经网络模型,模型包含茎层(S)、四个残差块(R1-R4)、全局平均池化层(GAP)和全连接层(FC)。其次,设置层深度(D)、通道数(C)、卷积核尺寸(K)的搜索空间,其中层深度 D∈{2,4,8,16},卷积核尺寸 K∈{3,5,9,15},通道数 C∈{16,32,64,128}。然后,使用两个不同规模的 ECG 数据集(Physionet2021 和 Alibaba)进行实验,通过宏平均 F1 分数评估模型性能,并采用异步连续减半算法(ASHA)进行超参数优化,同时运用数据增强策略提升模型泛化能力。
4.1 网络缩放参数的影响
通过实验发现,在 ECG 分类中,层深度、通道数和卷积核尺寸对模型性能的影响与计算机视觉领域存在显著差异。具体表现为:层深度(D)越小,模型性能越优,这与计算机视觉中更深网络性能更好的趋势相反;通道数(C)与性能呈正相关,增加通道数可提升分类准确性,这与计算机视觉结论一致;卷积核尺寸(K)越大,性能越差,与计算机视觉中较大核有利的情况相悖。例如,在 Physionet2021 数据集上,最优组合为 D=4、C=128、K=3,而最差组合为 D=8、C=16、K=15,且在 Alibaba 数据集上结果类似。
4.2 超参数搜索空间优化
研究表明,根据实验得出的最优缩放参数缩小超参数搜索空间,可在保证准确性的前提下显著减少计算量和调优时间。例如,在 Physionet2021 数据集上,使用 “Optimal” 搜索空间(D=4、C=128、K=3)时,F1 分数达 0.669,优于 “Large” 空间的 0.612,且搜索空间缩小至原大小的 1/64。
4.3 亚组分析
对不同数据源和标签的亚组分析显示,除个别极端不平衡的数据集(如 CPSC 数据库中的罕见类)外,整体性能趋势一致,表明研究结论具有一定普适性。Alibaba 数据集中的部分异常情况可能与标签 prevalence 低导致的类不平衡有关。
4.4 缩放参数与性能的相关性
进一步研究发现,ECG 信号的周期性是导致其与计算机视觉领域性能差异的关键因素。通过去除 ECG 信号的周期性(裁剪为 2 秒和 1 秒片段),层深度和卷积核尺寸与性能的负相关性减弱,而通道数的正相关性保持不变,验证了信号周期性对模型性能的影响机制。
研究结论表明,在 ECG 分类中,较浅的网络结构、更多的通道数和较小的卷积核尺寸可显著提升模型性能,且这一现象与 ECG 信号的周期性密切相关。该研究不仅打破了传统计算机视觉经验在医疗领域的直接套用,为 ECG 分类模型的优化提供了新的设计思路,还通过限定有效搜索空间提升了超参数调优效率,具有重要的临床应用价值和方法论启示。未来研究可进一步探索不同输入尺寸、数据集规模及半监督 / 无监督学习范式下的模型表现,以完善 ECG 分类的深度学习框架。