基于MobileNetV2编码器与多尺度特征注意力的视网膜血管分割新方法

《Scientific Reports》:Retinal vessel segmentation using multi scale feature attention with MobileNetV2 encoder

【字体: 时间:2025年12月10日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对视网膜疾病早期诊断中血管结构复杂、分割精度不足的挑战,提出了一种融合多尺度特征聚合(MSFA)、注意力机制和残差连接的MSFAUMobileNet模型。该模型以轻量级MobileNetV2为编码器,在DRIVE数据集上实现了99.99%的准确率、99.95%的Dice系数和99.94%的IoU,显著提升了细微血管结构的识别能力,为糖尿病视网膜病变等疾病的智能化诊断提供了高效解决方案。

  
视网膜作为眼睛的光敏感层,在视觉过程中起着至关重要的作用,而视网膜血管的健康状态更是诊断多种眼部疾病的关键指标。糖尿病视网膜病变、青光眼和年龄相关性黄斑变性(AMD)等视网膜疾病是全球致盲的主要原因,早期发现和定期监测对于有效治疗和避免视力丧失至关重要。然而,视网膜血管的自动分割一直面临巨大挑战——血管在尺寸、形状和方向上的巨大差异,以及复杂血管网络的精细结构,使得传统分割方法难以实现精准勾勒。
近年来,深度学习技术为视网膜血管分割带来了新的突破。其中,U-Net架构因其在生物医学图像分割中的优异表现而备受关注,但其在处理复杂血管网络时仍存在细节丢失和计算效率不足的问题。为了解决这些挑战,由Tanishq Soni领衔的研究团队在《Scientific Reports》上发表了题为"Retinal vessel segmentation using multi scale feature attention with MobileNetV2 encoder"的研究论文,提出了一种创新的MSFAUMobileNet模型。
该研究的核心在于构建一个能够同时实现高精度和高效率的视网膜血管分割系统。研究人员巧妙地将轻量级MobileNetV2作为编码器,结合多尺度特征聚合(MSFA)技术、注意力机制和残差连接,形成了一种强大的U-Net变体架构。这种设计不仅保证了模型的计算效率,更重要的是能够捕捉从粗大到细微的各级血管特征。
在技术方法层面,研究团队采用了系统的数据处理和分析流程。首先利用DRIVE数据集(包含40张高分辨率视网膜图像及对应的血管标注)进行模型训练和验证,通过归一化、尺寸调整(768×584至256×256)和数据增强(水平/垂直翻转、旋转、缩放)等预处理步骤优化输入数据。模型架构以MobileNetV2的13个瓶颈层作为特征提取器,通过多尺度卷积核(1×1、3×3、5×5、7×7)聚合空间信息,结合注意力机制突出重要血管区域,利用残差连接保持梯度流动,最终通过转置卷积重建分割图谱。评估指标涵盖准确率、Dice系数、IoU等7个维度,采用Focal Loss(γ=2.0,α=0.25)解决类别不平衡问题。
模型架构设计与性能验证
研究团队设计的MSFAUMobileNet模型展现了卓越的分割能力。编码器部分使用MobileNetV2的13个瓶颈层进行层次特征提取,在不同空间分辨率(64×64、32×32、16×16、8×8、4×4)上捕获血管特征。多尺度特征聚合(MSFA)模块通过不同大小的卷积核并行处理特征图,再通过拼接操作整合多尺度信息,使模型能够同时感知局部细节和全局上下文。注意力机制通过全局平均池化(GAP)和全局最大池化(GMP)生成注意力权重,突出重要通道的特征响应。残差连接的引入确保了低层特征信息在解码过程中的有效传递,防止了梯度消失问题。
多维度性能评估结果
在DRIVE数据集上的实验结果表明,MSFAUMobileNet模型在各项指标上均达到了近乎完美的水平。训练准确率和验证准确率均达到99.99%,训练损失和验证损失分别降至0.0012和0.0041,显示出优秀的收敛性和泛化能力。在分割特异性指标上,精确率达到99.94%,召回率达到99.99%,F1分数为99.97%,表明模型在减少假阳性的同时能够有效识别真实血管区域。在分割质量评估中,IoU达到99.94%,Dice系数达到99.97%,证明了预测结果与真实标注之间的高度一致性。
消融实验与对比分析
通过系统的消融实验,研究团队验证了各组件对模型性能的贡献。基线UMobileNet模型虽然取得了95.46%的验证准确率和90.40%的IoU,但在处理复杂血管结构时仍存在局限。加入多尺度特征提取后,模型性能显著提升,IoU提高至92.08%,Dice系数达到96.23%。当完整集成注意力机制后,所有指标均接近完美,验证了MSFAUMobileNet架构设计的合理性。统计检验结果(p<0.05)进一步证实了这些改进的显著性。
与现有技术的比较优势
与当前主流视网膜血管分割方法相比,MSFAUMobileNet展现出了明显优势。在Jaccard指数(IoU)和准确率两个关键指标上,该模型分别达到99.94%和99.99%,显著优于MPCCN模型(97.38%准确率,81.85% IoU)、Genetic U-Net(97.04%准确率,67.83% IoU)等方法。这种性能提升在视觉分析中也得到验证,模型生成的血管分割图与真实标注高度吻合,特别是在细微血管结构的保留上表现突出。
本研究通过创新性地融合MobileNetV2编码器、多尺度特征聚合、注意力机制和残差连接,成功开发了高效精确的视网膜血管分割模型。MSFAUMobileNet在DRIVE数据集上的卓越表现证明了其在复杂血管结构识别方面的强大能力,为糖尿病视网膜病变、青光眼等视网膜疾病的早期诊断和监测提供了可靠的技术支持。该模型的轻量级特性使其特别适合在便携式医疗设备和资源有限的临床环境中部署,有望推动眼科智能诊断技术的实际应用进程。未来工作的重点将放在模型的多中心验证和实时性能优化上,以进一步促进其在临床实践中的广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号