FISM模型:基于深度强化学习的糖尿病视网膜病变微动脉瘤和渗出液精准检测新方法
《BioData Mining》:FISM: harnessing deep learning and reinforcement learning for precision detection of microaneurysms and retinal exudates for early diabetic retinopathy diagnosis
【字体:
大
中
小
】
时间:2025年11月01日
来源:BioData Mining 6.1
编辑推荐:
本研究针对糖尿病视网膜病变(DR)早期诊断中微动脉瘤和渗出液检测精度不足的临床难题,开发了基于Segment Anything Model(SAM)的FISM深度学习框架。通过集成Transformer架构、注意力机制和生成对抗网络(GAN)数据增强技术,在DDR数据集上实现了96.32%的准确率和96.01%的IoU值,为DR早期筛查提供了高精度自动化诊断工具。
糖尿病视网膜病变(Diabetic Retinopathy, DR)作为糖尿病最常见的微血管并发症,已成为全球工作年龄人群视力丧失的首要原因。随着糖尿病患病率的持续攀升,DR的早期诊断面临严峻挑战。传统诊断依赖眼科医师手动检眼镜检查,不仅耗时耗力且存在主观判断差异,在医疗资源匮乏地区更难以实现大规模筛查。当前基于卷积神经网络(CNN)的自动化检测方法虽取得一定进展,但在微动脉瘤(Microaneurysms)和视网膜渗出液(Retinal Exudates)等早期病变的精准分割方面仍存在精度不足、泛化能力弱等技术瓶颈。
针对这一临床需求,Rehman等研究人员在《BioData Mining》发表题为"FISM: harnessing deep learning and reinforcement learning for precision detection of microaneurysms and retinal exudates for early diabetic retinopathy diagnosis"的研究论文,提出了一种创新性的Fundus Images Segmentation Model(FISM)模型。该研究利用包含13,000余张标注图像的DDR数据集,通过深度融合Transformer架构与强化学习技术,实现了DR早期病变的精准检测与分割。
关键技术方法包括:基于SAM架构的Transformer编码器-解码器设计,采用16×16像素块嵌入和多重上采样模块;生成对抗网络(GAN)数据增强技术提升模型鲁棒性;结合Dice损失和焦点损失的多任务优化函数;强化学习驱动的感兴趣区域自适应搜索机制。模型在DDR数据集(包含Seg-set和Grade-set两个子集)上完成训练验证,采用band separation(波段分离)预处理和综合归一化技术保障数据质量。
研究团队对SAM基础架构进行多项针对性改进:引入领域自适应微调策略,在视网膜图像特定特征提取层集成注意力机制;设计包含6个Transformer模块的层级结构,通过Patch Embedding(块嵌入)将512×512输入图像转化为32×32特征图,逐步上采样至原始分辨率;输出层采用Sigmoid激活函数生成二值化分割掩码。该设计有效捕获了视网膜病变的局部细节与全局上下文关联。
在病变分割任务中,FISM在微动脉瘤检测中达到96.32%的IoU(交并比)和94.24%的Dice系数,硬性渗出液分割精度为95.54% IoU,软性渗出液与出血灶检测指标分别为94.23%和91.65%。可视化结果显示,模型预测分割掩码与专家标注金标准高度吻合,尤其在微小病变边界定位方面表现突出。
在DR严重程度分类任务中,模型准确率达96.32%,精确度95.14%,召回率95.25%,F1-score 96.33%。ROC曲线分析显示,微动脉瘤、硬性渗出液、软性渗出液和出血灶的AUC(曲线下面积)值分别为96.0%、95.0%、96.5%和96.0%,证实模型具备优异的病变鉴别能力。
研究创新性地将强化学习框架应用于医疗图像分析,通过Q-learning算法和优势演员-评论者(A2C)方法实现自适应阈值优化。算法1展示了基于状态-动作奖励机制的参数调优过程,通过折扣因子γ=0.99平衡即时收益与长期回报,使模型能动态调整病灶检测敏感度。
与现有主流方法对比显示,FISM在准确率指标上较MEDCnet模型提升19个百分点,比MobileNet迁移学习方案提高5.08%。在误差指标方面,模型分类任务MAE(平均绝对误差)降至0.55,分割任务验证损失为0.53,显著优于对比方法。
研究结论表明,FISM模型通过深度融合Transformer与强化学习技术,有效解决了DR早期病变检测中的精度与鲁棒性难题。模型在保持高精度的同时具备临床实用性,其96.32%的检测准确率为大规模筛查提供了可靠工具。特别值得关注的是,该模型在微动脉瘤检测方面的卓越性能(96.32% IoU)对DR早期干预具有重要临床价值。
讨论部分指出,该研究的创新性体现在三个方面:首次将SAM架构成功适配于视网膜图像分析任务;开发了融合注意力机制与强化学习的混合优化策略;在DDR数据集上建立了新的性能基准。未来研究方向包括扩展模型对其它视网膜病变的检测能力,探索在移动设备上的部署可行性,以及开展多中心临床验证研究。
该技术的推广应用将显著缓解眼科医疗资源分布不均的现状,特别在基层医疗机构和远程医疗场景中具有重要应用前景。通过自动化DR筛查系统,有望实现糖尿病并发症的早发现、早诊断、早治疗,最终降低糖尿病性视力损伤的发病率。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号