基于混合注意力机制与粒子群优化的MobileNetV2模型在子宫内膜癌CT图像分类中的应用研究

【字体: 时间:2025年06月11日 来源:Informatics in Medicine Unlocked CS9.5

编辑推荐:

  本研究针对子宫内膜癌(EC)早期诊断难题,创新性地提出融合双注意力机制与粒子群优化(PSO)的MobileNetV2深度学习框架。研究人员通过构建KAUH-ECCTD数据集(含1,048例CT图像),采用几何变换增强数据,利用PSO自动优化学习率、dropout率等超参数,最终模型准确率达86.07%,AUC达97.33%,显著优于VGG16等传统模型。该研究为医学影像辅助诊断提供了可解释性强、泛化性好的智能解决方案。

  

子宫内膜癌作为妇科常见恶性肿瘤,早期诊断对提高患者生存率至关重要。然而传统诊断方法如组织活检具有侵入性,而CT等影像学检查存在假阳性率高、依赖医师经验等问题。随着人工智能技术的发展,深度学习在医学影像分析领域展现出巨大潜力,但现有模型普遍面临小样本数据下泛化能力不足、关键病灶区域识别不精准等挑战。针对这些临床痛点,来自约旦科技大学附属医院的研究团队在《Informatics in Medicine Unlocked》发表创新成果,通过融合前沿深度学习与优化算法,构建了高性能的子宫内膜癌智能诊断系统。

研究团队采用三项关键技术:1)构建多视角CT数据集KAUH-ECCTD(含300名患者的1,048张图像);2)基于MobileNetV2架构集成全局平均池化与Transformer式双注意力模块;3)应用粒子群优化(PSO)自动调节学习率(0.0011)、L2正则化系数(0.00647)等超参数。通过几何变换增强数据,采用余弦退火学习率调度策略提升模型稳定性。

【数据收集与预处理】
从King Abdullah大学医院获取的CT图像经标准化(256×256像素)、归一化(0-1范围)处理,按8:1:1划分训练集/验证集/测试集。数据包含矢状面、冠状面和轴向面三个视角,经病理确诊为恶性(407例)、良性(385例)和正常(292例)三类。

【模型架构设计】
创新性地在MobileNetV2倒残差块基础上,加入通道重校准(Squeeze-Excitation)和空间自注意力机制。通过GELU激活函数(β1
=0.9, β2
=0.999)和dropout(0.2)防止过拟合,分类头采用全局平均池化与538个神经元的全连接层。

【优化策略】
PSO算法以验证损失最小化为目标,在25-30次迭代中动态调整5个粒子群的超参数空间。关键优化参数包括注意力单元数(~500)、密集层神经元数(538)和权重衰减系数(0.00033)。

【性能评估】
在测试集上达到86.07%准确率、86.02%敏感性和91.45%特异性,显著优于对比模型。特别在恶性病例识别中,真阳性数达35例,AUC值97.33%表明优秀的二分类判别能力。注意力热图可视化显示模型能准确聚焦子宫内膜异常区域。

该研究通过智能算法与临床需求的深度结合,实现了三大突破:1)解决小样本医学影像分析的泛化难题;2)通过可解释的注意力机制提升临床可信度;3)建立自动化超参数优化流程。未来通过多中心验证和MRI多模态融合,有望成为妇科肿瘤筛查的有力工具,为AI辅助诊断系统的临床转化提供重要范式。研究采用的PSO-MobileNetV2混合架构,也为其他医学影像分类任务提供了可借鉴的技术路线。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号