SAFF-ConvNeXt:一种用于医学影像中肾脏疾病检测的尺度感知特征融合与SE注意力增强框架

《IEEE Access》:SAFF-ConvNeXt: A Scale-Aware Feature Fusion and SE-Attention Enhanced ConvNeXt Framework for Kidney Disease Detection in Medical Imaging

【字体: 时间:2025年11月27日 来源:IEEE Access 3.6

编辑推荐:

  为解决慢性肾脏病(CKD)早期诊断中非侵入性方案缺乏、现有深度学习模型在CT影像多分类任务中性能不足的问题,研究人员开展了基于ConvNeXtBase骨干网络、结合多尺度特征融合与SE注意力机制的研究。该研究提出的SAFF-ConvNeXt模型在CTK数据集上取得了99.75%的准确率、99.83%的特异性及99.39%的F1分数,显著优于DenseNet121、EfficientNet-B0等对比模型。该模型通过Grad-CAM技术提供可解释性,为临床辅助诊断提供了高效、可靠的自动化工具,具有重要的临床应用价值。

  
慢性肾脏病(CKD)是一个严峻的全球性健康问题,影响着超过10%的人口,且往往在晚期才被发现,可能导致肾衰竭、贫血、骨质疏松和心脏病等严重并发症。早期检测对于改善患者预后至关重要,然而,目前的诊断方法缺乏早期、非侵入性的解决方案。全球范围内,尤其是在发展中国家,肾病专家和放射科医生的短缺进一步限制了及时、准确的诊断。尽管人工智能(AI)在医学影像分析领域展现出巨大潜力,但现有研究多局限于小数据集或单一疾病分类,且大多依赖传统的机器学习方法或超声数据,其全面性不如CT扫描。
为了应对这一挑战,研究人员在《IEEE Access》上发表了一项研究,提出了一种名为SAFF-ConvNeXt的新型深度学习(DL)架构,旨在利用CT影像实现肾脏疾病的早期、高精度检测。该研究通过整合预训练的ConvNeXtBase骨干网络、多尺度特征融合策略和SE注意力机制,构建了一个轻量级且高效的分类模型,并在公开数据集上取得了卓越的性能,为临床辅助诊断提供了强有力的工具。
为了开展这项研究,研究人员主要采用了以下关键技术方法:首先,他们利用CTK数据集,该数据集包含12,446张CT图像,涵盖正常、囊肿、结石和肿瘤四种类别。在数据预处理阶段,采用了图像重采样、归一化以及下采样技术来处理数据不平衡问题。在模型构建方面,核心是提出了SAFF-ConvNeXt模型,该模型以ConvNeXtBase为骨干网络,集成了SE注意力模块以增强通道特征表示,并设计了多尺度特征融合策略,有效结合了低层纹理信息和高层语义信息。在模型训练与评估中,采用了5折交叉验证,并利用Grad-CAM技术进行模型决策的可视化解释,以增强其临床可解释性。
IV. 结果概述与分析
A. 有效性测量
SAFF-ConvNeXt模型在CTK数据集上表现卓越,其平均准确率达到99.75%,特异性为99.83%,灵敏度为99.38%,精确度为99.42%,F1分数为99.39%。在与其他五种深度学习模型(DenseNet121、EfficientNet-B0、MobileNet、VGG19和Xception)的比较中,SAFF-ConvNeXt在所有评估指标上均取得了最优异的成绩,证明了其在肾脏疾病多分类任务中的优越性。
B. 计算效率
尽管SAFF-ConvNeXt模型的总参数量较大(75,318,660),但其可训练参数量仅为4,596,996,占总参数量的一小部分。这种参数效率使得模型能够有效利用预训练权重进行迁移学习,并针对任务数据集进行微调,从而降低了过拟合风险并缩短了训练时间。虽然其推理吞吐量(约0.47 FPS)低于一些轻量级模型,但其卓越的判别能力和鲁棒的特征表示使其特别适用于复杂的医学影像任务。
C. 实验框架
实验在Kaggle环境中进行,使用NVIDIA Tesla T4 GPU(16GB VRAM)和13代Intel Core i9-13900H CPU。研究采用Python编程语言和TensorFlow库构建和部署深度学习模型。关键超参数包括图像尺寸224×224、批次大小32、优化器Adam、初始学习率0.001以及20个训练轮次。
D. 提出的SAFF-ConvNeXt模型评估
通过5折交叉验证,SAFF-ConvNeXt模型在训练和验证过程中均表现出快速收敛和稳定的性能。训练准确率在所有折中均迅速上升并接近100%,训练损失则迅速下降至接近零。验证准确率也呈现出强劲的上升趋势,验证损失持续下降,表明模型具有良好的泛化能力,且没有出现明显的过拟合现象。混淆矩阵分析进一步证实了该模型在区分囊肿、正常、结石和肿瘤四种类别上的高精度和可靠性。
E. 消融研究
消融研究通过两个实验来验证模型组件的有效性。第一个实验比较了不同优化器(Adam、RMSprop、Adamax)和学习率(0.001、0.0001、0.00001)的组合,结果表明Adam优化器在0.001的学习率下取得了最高的准确率(99.754%)。第二个实验评估了SE注意力模块和多尺度特征融合策略的贡献。结果显示,包含这两个组件的完整模型性能最佳(准确率99.754%),而移除其中任何一个组件都会导致性能下降,证明了这两个设计元素对于提升模型性能是互补且必要的。
F. 结果的统计评估
对SAFF-ConvNeXt模型结果的统计评估显示,其准确率和F1分数的方差、标准差和标准误均值均为所有对比模型中最小的,表明该模型的性能最为稳定和可靠。此外,Friedman排序检验和Nemenyi事后检验也证实了SAFF-ConvNeXt在统计上显著优于其他对比模型。
G. 外部验证
为了验证模型的泛化能力,研究人员在另一个独立的数据集(轴向CT成像数据集)上进行了测试。SAFF-ConvNeXt模型在该数据集上同样取得了优异的成绩,准确率达到95.26%,F1分数为95.23%,显著优于其他对比模型,证明了该模型在不同数据分布下的鲁棒性和泛化能力。
H. 讨论
SAFF-ConvNeXt模型通过将ConvNeXtBase骨干网络与SE模块和多尺度特征融合方法相结合,带来了显著的优势。这种集成增强了模型提取详细局部纹理和高级语义信息的能力,使其能够识别肾脏图像中复杂的解剖学差异。SE模块提供了自适应的通道注意力,使网络能够聚焦于重要的诊断特征,同时抑制无关噪声,从而提高了整体分类准确性和可解释性。多尺度特征融合方法有助于从不同层次收集信息,增强了模型的鲁棒性和在不同成像环境下的泛化能力。
I. 与最先进技术的对比分析
SAFF-ConvNeXt模型在性能上超越了大多数当代方法,证明了其在辅助医疗专业人员早期识别慢性肾脏病方面的有效性。该模型识别影像数据中作为疾病早期指标的细微变化的能力,使得临床医生能够在病情恶化之前采取干预措施。SAFF-ConvNeXt模型的高精度、适应性和模式识别能力促进了早期诊断,这对于减缓疾病进展、改善患者预后以及降低诊断过程的时间和成本至关重要。
V. 结论
本研究引入了SAFF-ConvNeXt,这是一种用于识别慢性肾脏病(CKD)的创新且增强的深度学习模型。该模型将ConvNeXtBase骨干网络与SE模块和多尺度特征融合方法相结合。它通过提取详细的局部纹理以及高级语义信息的能力,改善了医疗保健提供者对CKD的早期检测,使其能够识别肾脏图像中复杂的解剖学差异。在CTK数据集上的测试表明,SAFF-ConvNeXt模型在准确率、特异性、灵敏度、精确度和F1分数方面均取得了显著成果,超越了其他五种分类器。该模型在轴向CT成像数据集上的外部验证也证明了其鲁棒性和泛化能力。这项创新不仅减轻了放射科医生的负担,还为他们提供了一个自动化系统来精确评估肾功能,从而降低了误诊的可能性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号