基于 EfficientNet-B0 的卷积神经网络与双向长短期记忆网络混合模型在乳腺癌高精度检测与分类中的应用

【字体: 时间:2025年04月10日 来源:Scientific Reports 3.8

编辑推荐:

  乳腺癌检测是医学成像领域的难题。研究人员开展基于卷积神经网络(CNNs)、双向长短期记忆网络(Bi-LSTM)和 EfficientNet-B0 的混合模型研究。结果显示该模型在区分良恶性肿瘤上精度达 99.2%,为乳腺癌检测提供新方法,意义重大。

  在医学领域,乳腺癌一直是女性健康的重大威胁。每年全球有超过 67 万人因乳腺癌失去生命,且新发病例逐年增多。早期检测对于降低乳腺癌死亡率至关重要,它能为患者提供更有效的治疗方案,显著提高生存率。然而,乳腺癌在早期往往没有明显症状,这就需要精准可靠的检测方法。传统的检测手段,像乳腺 X 线摄影,虽然是检测早期乳腺癌的常用方法,但在检测致密乳腺组织中的肿瘤时存在局限性;超声和磁共振成像(MRI)虽可作为辅助手段,但存在主观解读差异大等问题。传统的统计和机器学习模型,如支持向量机(SVM)、随机森林等,在处理复杂的乳腺癌数据时,难以捕捉数据中的复杂关系,在高维数据中表现不佳。深度学习模型,如卷积神经网络(CNNs),虽然在医学图像分析中取得了一定进展,能够自动学习图像特征,但在捕捉肿瘤生长等时间模式方面存在不足。因此,开发一种更精准、高效的乳腺癌检测模型迫在眉睫。
为了解决这些问题,来自 Galgotias University、Koneru Lakshmaiah Education Foundation、GLA University 等多个机构的研究人员展开了深入研究。他们提出了一种新颖的混合模型,结合了卷积神经网络(CNNs)、双向长短期记忆网络(Bi-LSTM)和预训练模型 EfficientNet-B0。该研究成果发表在《Scientific Reports》上,为乳腺癌检测带来了新的突破。

研究人员在此次研究中用到的主要关键技术方法包括:利用来自癌症成像存档 - 数字化乳腺筛查数据库(CBIS-DDSM)和乳腺图像分析协会(MIAS)的数据集进行研究;采用转移学习技术,借助在 ImageNet 数据集上预训练的 EfficientNet-B0 提取特征;使用改进的 CNNs 进行特征提取,优化网络结构和参数;利用 Bi-LSTM 模型处理时间依赖性;运用 Adam 优化算法调整模型参数,提高模型性能 。

下面介绍该研究的主要结果:

  • 模拟配置和参数:在 Anaconda 环境中,使用 Python 编程语言实现模型。硬件方面,配备 25GB HDD、16GB RAM,由 Intel I-5 及以上处理器和 NVIDIA RTX 3090 GPU 提供支持;软件方面,集成了 Pandas、Matplotlib、TensorFlow 等多个关键库。模型的学习率设为 0.0001,批大小为 32,训练 50 轮,采用 Adam、SGD、RMSprop 等优化器,dropout 率设为 0.3 。
  • 模拟结果:在 CBIS-DDSM 数据集上,该混合模型在二分类任务中准确率达到 99.30%,敏感度为 97.85%;在多分类任务中准确率为 99.08%,敏感度为 96.05%。在 MIAS 数据集上,未进行数据预处理时,混合模型在二分类任务中准确率为 89.20%,敏感度为 80.00%;数据预处理后,准确率提升至 99.00%,敏感度为 97.00%。在多分类任务中,对良性、恶性和正常类别的准确率分别达到 99.40%、98.50% 和 97.80% 。
  • 不同优化器和数据预处理的影响:实验表明,Adam 优化器在准确率、敏感度等关键指标上表现最佳。数据预处理能显著提升模型性能,减少噪声,优化特征提取,使模型学习效果更好。
  • 消融分析:通过对模型组件的消融分析发现,EfficientNet-B0 用于特征提取、Bi-LSTM 用于时间建模的组合能达到最佳性能。去除 Bi-LSTM 或 EfficientNet-B0 会导致模型准确率下降,证明了各组件的重要性 。

研究结论和讨论部分指出,该混合模型在多种数据集和分类任务中表现卓越。它结合了 EfficientNet-B0 强大的特征提取能力和 Bi-LSTM 处理时间依赖性的优势,通过数据预处理和 Adam 优化器的协同作用,显著提升了性能。与传统模型相比,该混合模型在准确率、敏感度、特异性和 F1 分数等多个指标上表现更优,能够有效处理复杂的分类任务,对乳腺癌的早期检测和诊断具有重要意义。它为临床医生提供了一个更可靠、高效的工具,有望在实际医疗应用中发挥重要作用,推动乳腺癌诊断技术的发展。然而,研究也存在一些局限性,如数据集的多样性仍有待提高,模型在临床实时应用中的速度和效率还需进一步优化,模型的可解释性也需要进一步增强。未来的研究可以从扩大和多样化数据集、探索更多优化技术、实现实时临床应用、增强模型可解释性等方面展开,进一步提升模型性能,使其更好地服务于医疗领域。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号