编辑推荐:
针对视网膜图像血管(RIV)分割中低对比度毛细血管导致的精度不足问题,研究人员提出 MSPDD-Net。通过双编码路径、M-FSSP 模块及双解码路径,在 DRIVE、STARE、CHASEDB1 数据集上分割精度达 97.45%、97.76%、97.88%,为 RIV 分割提供有效方案。
论文解读
在医学影像领域,视网膜血管的精准分割如同打开眼底疾病诊断的 “钥匙”。糖尿病、青光眼、高血压等疾病往往会在视网膜血管中留下蛛丝马迹,而视网膜血管结构复杂,尤其是相互交叉的细血管和低对比度的毛细血管,如同隐藏在迷雾中的小径,让传统算法难以准确捕捉。现有基于卷积神经网络(CNN)的方法虽在特征提取上表现出色,但难以建模全局上下文信息,导致分割结果中血管断裂;引入 Transformer 结构的方法虽能捕捉长距离依赖,却在边缘特征恢复上力有不逮。如何在全局信息捕捉与边缘细节还原之间找到平衡,成为困扰研究者的难题。
为攻克这一挑战,西安邮电大学的研究人员开展了深入研究,相关成果发表在《Computers in Biology and Medicine》。他们提出了一种名为 MSPDD-Net(Mamba 语义感知双解码网络)的新型模型,旨在通过创新架构实现视网膜图像血管的高精度分割,为眼底疾病的早期检测与诊断提供更可靠的技术支撑。
主要关键技术方法
研究采用了三大核心技术:①设计包含位置敏感跨层交互(PSCLI)策略的双编码路径,通过卷积提取初始编码特征,再利用 PSCLI 机制构建第二编码路径以获取富含语义信息的精细化编码特征;②开发 Mamba 全尺度语义感知(M-FSSP)模块并嵌入网络瓶颈层,用于捕获视网膜图像的全尺度语义特征,引导解码过程;③构建融合全尺度语义注入(FSSI)与小波边缘注意力(WEA)的双解码路径,先通过 FSSI 模块缓解语义间隙,再利用 WEA 机制对初始解码特征进行二次融合解码以突出边缘特征。实验基于 DRIVE、STARE、CHASEDB1 三个公开视网膜图像数据集展开。
研究结果
双编码路径结合 PSCLI 策略的有效性
传统单编码路径难以同时捕获高层语义和低层细节,导致特征表示不完整。MSPDD-Net 通过 PSCLI 模块自适应融合相邻层的初始编码特征,生成兼具高层语义线索与低层细节信息的精细化编码特征,为后续分割提供更丰富的特征基础。
M-FSSP 模块对全局语义特征的捕捉
多数现有方法忽视复杂血管结构精准分割所需的全局上下文信息。M-FSSP 模块通过聚合所有层的编码特征,获取视网膜图像的全尺度语义特征,有效引导解码过程,提升分割结果的完整性,尤其在处理具有复杂结构的血管时优势显著。
双解码路径对边缘特征的强化
传统解码路径缺乏边缘特征恢复能力,常导致低对比度毛细血管分割不足。MSPDD-Net 的双解码路径通过 FSSI 模块进行首次解码以缓解语义间隙,再利用 WEA 机制对初始解码特征进行二次融合解码,着重强调视网膜图像中的边缘信息,显著提高了低对比度毛细血管的分割精度。
数据集上的优越性能
在 DRIVE、STARE、CHASEDB1 数据集上,MSPDD-Net 的分割精度分别达到 97.45%、97.76%、97.88%。其中,在 STARE 数据集上相比基线网络提升了 1.59%,充分验证了该模型在视网膜图像血管分割任务中的有效性和先进性。
研究结论与讨论
MSPDD-Net 通过 PSCLI-based 双编码器、M-FSSP 模块和 WEA-based 双解码器的创新设计,成功解决了视网膜图像血管分割中全局特征提取与边缘信息恢复难以平衡的问题,尤其对包含低对比度毛细血管的复杂血管结构表现出卓越的分割能力。该研究不仅为视网膜图像血管分割提供了一种高效的解决方案,也为医学影像领域中类似复杂结构的分割任务提供了新的思路和技术借鉴。未来,可进一步探索该模型在更多医学影像数据集及临床实际场景中的应用,以推动其向实际诊断工具的转化,为智能医疗的发展贡献更多力量。