
-
生物通官微
陪你抓住生命科技
跳动的脉搏
MAFNet:基于自适应多尺度特征融合的糖尿病视网膜病变细粒度分级新模型
【字体: 大 中 小 】 时间:2025年09月04日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对糖尿病视网膜病变(DR)自动分级中多尺度病灶特征融合与空间关系建模的双重挑战,提出创新性MAFNet模型。通过构建分层全局上下文模块(HGCM)、多尺度自适应注意力模块(MSAM)和关系多头注意力模块(RMA),实现从微观到宏观病灶的精准捕获。在DDR、Messidor-2和APTOS数据集上分别达到0.934、0.917和0.936的二次加权Kappa值,显著优于LANet等现有方法,为临床DR自动化分级提供新范式。
糖尿病视网膜病变(DR)作为糖尿病最常见的并发症之一,是全球致盲的首要原因。随着糖尿病患病率持续攀升,DR发病率呈现显著上升趋势。传统诊断依赖眼科专家人工评估眼底图像,不仅耗时耗力,且对微小病灶如微动脉瘤的识别存在困难,导致误诊率居高不下。尽管深度学习技术已广泛应用于DR自动分级,现有方法仍面临两大核心挑战:一是病灶形态、尺寸和分布的极端异质性,单一感受野难以同时捕捉从微米级微动脉瘤到大面积出血的多尺度特征;二是相邻病变阶段存在特征重叠和边界模糊,导致分级混淆。
为突破这些技术瓶颈,湖南中医药大学信息科学与工程学院Lei Sun团队在《Scientific Reports》发表研究,提出MAFNet(Multi-scale Adaptive Fine-grained Network)创新模型。该研究通过三个核心技术模块构建多尺度特征整合框架:分层全局上下文模块(HGCM)采用多尺度池化与动态特征融合策略,实现从微观到宏观病灶的跨尺度捕获;多尺度自适应注意力模块(MSAM)通过空间位置权重动态调整强化关键病灶区域表征;关系多头注意力模块(RMA)则通过并行多头机制建模特征间复杂关系。研究还创新性地采用回归-分类双任务学习框架,将DR分级转化为连续与离散相结合的优化问题。
关键技术方法包括:以ConvNeXt为骨干网络,集成Shuffle Attention模块增强特征表达;采用DDR(13,673张图像)、Messidor-2(1,748张)和APTOS(3,662张)三个公开数据集;通过随机翻转、裁剪和对比度增强进行数据增广;使用Adam优化器(初始学习率5e-4)和动态多任务损失函数(交叉熵+均方误差)进行端到端训练。
【研究结果】
骨干网络选择实验:ConvNeXt以0.887 Kappa值显著优于DenseNet-121(0.827)等传统架构,证明其多尺度特征提取优势。
多任务学习验证:回归-分类联合策略(CE+MSE)使Kappa值提升至0.934,较单一分类任务(0.922)和回归任务(0.928)更优。
模块消融实验:完整MAFNet(含HGCM+MSAM+RMA)达到0.934 Kappa值,较基线模型(0.887)提升5.3%,证明多模块协同有效性。
跨数据集测试:在Messidor-2和APTOS上分别取得0.917和0.936 Kappa值,显示强泛化能力。

研究通过Grad-CAM可视化证实,HGCM能精准聚焦微动脉瘤等微小病灶(1级DR),而MSAM对出血灶(2-3级)和渗出物(4级)具有更高响应度。如图6所示,完整模型的热力图显示其对多尺度病灶的空间分布和语义关联具有更全面的理解。
结论部分指出,MAFNet的创新性体现在三个方面:技术层面,首次实现多尺度特征提取(HGCM)、自适应空间权重分配(MSAM)和特征关系建模(RMA)的有机统一;临床层面,0.934的Kappa值达到目前DR分级最高精度;应用层面,83.89M参数量在保持精度的同时满足临床部署需求。该研究为眼底疾病的计算机辅助诊断提供了新范式,其多尺度特征融合策略对青光眼、年龄相关性黄斑变性等疾病的自动分级具有重要借鉴意义。未来工作将探索模型轻量化设计和多模态数据融合,以进一步提升临床适用性。

生物通微信公众号
知名企业招聘