基于高效深度学习架构EfficientNet-B9的脑肿瘤MRI高精度分类研究

《Results in Engineering》:Rethinking model of EfficientNet-B9 for Brain Tumor Classification: A High-Precision Deep Learning Approach

【字体: 时间:2025年11月05日 来源:Results in Engineering 7.9

编辑推荐:

  本研究针对脑肿瘤MRI图像人工诊断效率低、易出错的问题,开发了一种基于定制化EfficientNet-B9模型的高性能深度学习框架。该研究采用复合缩放策略优化网络深度、宽度和分辨率,处理800×800像素高分辨率输入图像,在Br35H数据集上实现了98.33%的分类准确率,为临床精准诊断提供了可靠工具。

  
脑肿瘤是全球范围内最致命的疾病之一,如果不能及时诊断和治疗,会迅速恶化患者的健康状况甚至导致死亡。尽管医学影像和神经外科技术取得了显著进步,但脑肿瘤仍然是重大的公共卫生问题。据估计,2025年美国将诊断出约24,820例新的恶性脑肿瘤和脊髓肿瘤病例,预计约有18,330例死亡。这些肿瘤在癌症相关死亡原因中排名第九,五年相对生存率仍然较低,仅为35.7%,对于40岁以上的成年人更是下降到约21%,这凸显了对更有效诊断工具的迫切需求。
传统上,脑肿瘤的诊断依赖于放射科医生对磁共振成像(MRI)图像的手动解读,这个过程既耗时又容易受到解读者主观因素的影响。随着人工智能,特别是深度学习技术的发展,卷积神经网络(CNN)等模型现在被广泛应用于脑肿瘤的分类和分割任务。这些模型能够直接从MRI图像中学习模式,通过分析细微的图像特征来帮助检测肿瘤。然而,早期的深度学习模型如VGGNet、ResNet和GoogleNet虽然性能有所提升,但需要大量的内存并且训练困难。随后,EfficientNet系列模型因其采用复合缩放方法平衡深度、宽度和分辨率而变得流行,但在处理需要高诊断精度的临床场景时,往往缺乏捕捉详细多尺度空间和上下文信息的能力。
为了解决这些局限性,研究人员K. Muthulakshmi和M. Jayalakshmi开展了一项创新性研究,旨在开发一个增强型的、基于EfficientNet-B9的深度学习框架,用于脑肿瘤MRI图像的二元分类。他们的研究成果发表在《Results in Engineering》期刊上。
为了开展这项研究,研究人员主要采用了几个关键技术方法。他们利用了公开的Br35H脑MRI数据集,该数据集包含3000张T1加权对比增强MRI图像,均衡地分为1500张肿瘤和1500张非肿瘤图像。研究核心是构建一个定制化的EfficientNet-B9模型,该模型将复合缩放系数φ提升至9,从而显著增加了网络的深度、宽度和输入分辨率。模型架构包含约1413个卷积层,采用MBConv模块、Swish激活函数以及高达0.7的丢弃率进行正则化。模型训练在Kaggle云平台上进行,使用Python编程语言,依托TensorFlow和Keras框架,并利用NVIDIA Tesla P100 GPU进行加速。训练过程采用Adam优化器和二元交叉熵损失函数,共进行35个epoch,批量大小为8,输入图像分辨率固定为800×800像素。模型的性能通过准确率、精确率、召回率和F1分数等指标进行严格评估,并采用了k折交叉验证来确保结果的稳健性。
研究结果
训练和验证结果
研究表明,在EfficientNet系列变体(B0到B9)中,提出的EfficientNet-B9模型在所有评估指标上均表现出最优性能。该模型在Br35H数据集上达到了98.33%的分类准确率、99.03%的精确率、97.76%的召回率和98.39%的F1分数。通过ROC曲线和混淆矩阵的分析,证实了该模型在区分肿瘤和非肿瘤脑MRI图像方面的卓越能力。
在不同数据集上的性能
为了评估模型的泛化能力,研究在三个公开的MRI数据集上进行了测试:Br35H、Figshare和Brain Tumor MRI数据集。结果显示,EfficientNet-B9在Br35H数据集上表现最佳,平均准确率达到98.17%,F1分数为98.23%。在Figshare和Brain Tumor MRI这两个多分类数据集上,模型也取得了具有竞争力的结果,证明了其对不同临床成像条件的适应性。
学习率调整
实验比较了不同学习率(0.01, 0.001, 0.0001)对模型性能的影响。结果表明,学习率为0.001时,模型取得了最佳的平衡,准确率达到97.58%,显著优于其他学习率设置。
丢弃层比较
研究评估了不同丢弃率(0.3, 0.5, 0.7)对模型泛化能力的影响。结果显示,丢弃率为0.7时,模型取得了最佳的总体性能(准确率98.33%),表明更高的丢弃率能更有效地减少过拟合,特别是在具有高记忆风险的复杂肿瘤数据集中。
消融研究分析
消融研究系统地调查了EfficientNet-B9模型中核心架构元素的贡献。研究发现,深层主干网络不可或缺;移除注意力模块会导致召回率显著下降;移除特征融合层也会影响结果。完整的模型配置(包括深度主干、注意力机制和融合层)在所有评估指标上均表现出最优性能,验证了其设计的有效性。
交叉验证
通过5折和10折交叉验证,模型分别达到了95.03%和95.85%的平均准确率。尽管相较于单次划分的准确率略有下降,但这种变化是预期的,交叉验证提供了更严格、更可靠的性能度量。各折之间准确率和损失的低方差证实了模型具有强大的鲁棒性、最小的过拟合以及跨不同数据子集的稳定分类行为。
研究结论与意义
该研究成功开发并验证了一个基于定制化EfficientNet-B9架构的高精度脑肿瘤分类模型。该模型通过复合缩放策略将输入分辨率提升至800×800像素,并集成了Swish激活、MBConv块和高丢弃率正则化等先进组件,使其能够有效学习复杂且细微的肿瘤特异性模式。
该模型在Br35H数据集上取得了领先的性能(准确率98.33%),并且在不同MRI数据集上展现了良好的泛化能力。与VGG16、ResNet-50以及EfficientNet-B0到B8等其他先进模型相比,EfficientNet-B9在准确率、精确率、召回率和F1分数上均表现出优势。其高召回率和平衡的F1分数凸显了模型在检测细微肿瘤特征并最大限度减少错误预测方面的可靠性。
在计算方面,尽管EfficientNet-B9是EfficientNet家族中较为复杂和资源密集的变体之一,但其训练收敛速度快(约35个epoch),并且在标准GPU上具有可行的推理时间。考虑到其在临床相关数据集上的强大性能,所提出的EfficientNet-B9模型显示出在实际诊断工作流程中应用的巨大潜力,为脑肿瘤的及时、准确诊断提供了可靠的自动化工具,有望改善患者预后。
未来的工作将集中于将方法扩展到多类肿瘤分类,结合先进的数据增强技术,并纳入更多异构数据集以更好地验证模型的鲁棒性和泛化能力。同时,探索模型剪枝、量化等优化策略以提升计算效率,并解决模型可解释性、临床医生信任度等伦理和实际整合问题,对于确保其在临床环境中透明、可靠和符合伦理地使用至关重要。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号