编辑推荐:
在视网膜图像分析中,视盘(OD)分割对多种致盲性疾病的诊断极为关键。研究人员开展了多尺度引导注意力网络(MSGANet-OD)的研究。结果显示,该方法在临床及公共数据集上表现优异。这为自动评估视神经异常及血管变化提供了有力支持。
在眼科医学领域,视网膜图像对视盘(Optic Disc,OD)的准确分析是诊断和评估多种威胁视力疾病的重要依据,如青光眼、糖尿病性视网膜病变等。然而,传统的 OD 分割方法存在诸多问题。基于图像分析的方法可分为两类,一类是基于深度学习的方法,像卷积神经网络(CNN)、全卷积网络(FCN)、U - Net 等,虽能自动学习特征,但对 OD 光照不一致、周围结构重叠敏感,且受视网膜异常影响大;另一类是量化外观的方法,易将明亮血管和渗出物误判为视盘,还需复杂的预处理和参数选择。对于眼科动力眼压测量(ophthalmodynamometry)图像,更是缺乏有效的自动分割方法,这类图像中 OD 区域受多种因素干扰,分割难度极大。
为了解决这些难题,来自澳大利亚 Lions Eye Institute 的研究人员展开了深入研究。他们提出了一种名为多尺度引导注意力网络(MSGANet-OD)的深度学习方法,相关研究成果发表在《Computer Methods and Programs in Biomedicine Update》上。
研究人员采用了多项关键技术方法。在网络架构上,基于 U - Net 架构构建 MSGANet-OD,包含双分支多尺度特征编码和引导注意力(Guided Attention,GA)模块。双分支分别从 RGB 和 CIELAB 颜色空间图像提取特征,利用 Res2Net 学习多尺度特征。GA 模块基于亮度特征,通过自注意力引导过滤和全局上下文分析强化 OD 区域特征。同时,设计了包含交叉熵损失(Lossce)、OD - 血管重叠损失(Lossvo)和椭圆拟合损失(Lossellipse)的自定义损失函数,以解决血管干扰和 OD 形状约束问题。在训练过程中,使用 Adam 优化器,对数据进行增强处理,并在特定的系统平台上开展实验。
在研究结果方面:
- 临床数据集评估:在 LEI - OD 临床数据集上,MSGANet-OD 取得了 96.14% 的分割准确率、94.36% 的灵敏度、97.22% 的特异性、93.01% 的骰子系数和 87.89% 的交并比(IoU)分数,优于 DeepLab、PspNet、SegNet 和基线 U - Net 等常用分割方法。
- 公共数据集评估:在 DRISHTI - GS、RIM - ONE - r3 和 REFUGE1 等公共数据集上,MSGANet-OD 同样表现出色。例如在 DRISHTI - GS 数据集上,准确率达 99.7%,灵敏度 92.1%,特异性 99.9%,骰子系数 96.2%,IoU 91.3%。在评估视杯(Optic Cup,OC)分割时,也取得了不错的成绩。
- 消融研究:通过对比仅核心 U - Net、U - Net 添加双分支多尺度编码器和完整的 MSGANet-OD 这三种网络,发现完整的 MSGANet-OD 能更准确地分割 OD 像素,各项评估指标得分更高。
研究结论和讨论部分表明,MSGANet-OD 在视网膜图像 OD 分割上展现出卓越性能。其多尺度学习和引导注意力机制提升了分割效果,自定义损失函数有效解决了 OD 分割面临的难题。该方法能够准确分割复杂病变图像中的 OD,对不同神经病理图像具有较强的鲁棒性。这一成果可应用于自动临床诊断系统,帮助评估青光眼、糖尿病性视网膜病变等疾病,还可用于非侵入性颅内压(ICP)估计,具有重要的临床应用价值,为眼科疾病的诊断和治疗提供了新的有力工具。