基于并行扩张卷积检测变换器(PDC-DETR)的黄斑变性实时筛查新方法

《BMC Medical Imaging》:PDC-DETR: a Parallel Dilated Convolutional Detection Transformer for preliminary screening of multiple macular degeneration

【字体: 时间:2025年11月04日 来源:BMC Medical Imaging 3.2

编辑推荐:

  本研究针对光学相干断层扫描(OCT)图像中黄斑变性多尺度特征难以捕捉导致的误诊问题,提出了一种轻量化实时检测模型PDC-DETR。通过并行特征优化注意力金字塔网络(PFOAPN)融合全局与局部特征,结合动态梯度分配的Wise-MPDIoU损失函数,在仅38.2 MB参数量下实现94.1%分类准确率及71 FPS的实时检测性能,为临床自动化筛查提供新方案。

  
在全球致盲性眼病中,黄斑变性、青光眼和白内障位列前茅,其中黄斑变性因损害中心视力而尤为棘手。光学相干断层扫描(OCT)作为视网膜疾病诊断的金标准,虽能提供高分辨率横断面图像,但医生手动判读耗时且主观性强,易漏诊误诊。更棘手的是,黄斑变性病变形态呈现多尺度、不规则的特点,传统人工智能模型难以兼顾特征捕捉的精度与效率,临床实时筛查需求远未满足。
为此,Wang等人在《BMC Medical Imaging》发表研究,提出并行扩张卷积检测变换器(PDC-DETR)。该模型以RT-DETR为基线,引入三大创新:首先,并行特征优化注意力金字塔网络(PFOAPN)通过分支注意力采样模块(BAUpsampling/BADownsampling)和并行扩张卷积(PDC)模块,同步提取病变的全局上下文与局部细节;其次,Wise-MPDIoU损失函数融合动态非单调聚焦机制,优化边界框回归精度;最后,轻量化设计使模型参数量仅38.2 MB,在保持71 FPS实时速度的同时,对五类黄斑变性(糖尿病性黄斑水肿DME、中心性浆液性脉络膜视网膜病变CSC、黄斑裂孔MH、脉络膜新生血管CNV、玻璃膜疣Drusen)的检测准确率达94.1%。
关键技术方法包括:基于ResNet-18骨干网络的多尺度特征提取;注意力引导的并行采样模块处理不同尺度目标;PDCC3模块通过跨阶段连接优化特征复用;Wise-MPDIoU损失函数引入异常值因子β=LMPDIoU?/LˉMPDIoU动态分配梯度。实验使用5400张OCT图像(来源:公开数据集OCT2017、Retinal-OCT-C8及大连市中心医院伦理审核数据),按7:1:1划分训练/验证/测试集。
模型对比实验
与12种主流检测模型(如YOLOv5m、RT-DETR-R18)相比,PDC-DETR的mAP50提升至94.1%,mAP50-95达55.5%,参数量(38.2 MB)和计算量(58.5 GFLOPs)均低于多数对比模型。训练曲线显示,其收敛过程较YOLO系列更平滑,得益于Transformer的端到端设计。
多尺度特征融合模块对比
PFOAPN在mAP50上较传统特征金字塔网络(如PaFPN、BiFPN)提升1.9%-3.2%,其分支注意力机制有效保留细节信息,抑制冗余噪声。
损失函数对比
Wise-MPDIoU在mAP50上较GIoU、DIoU等基线提升1.2%-2.1%,通过动态梯度分配缓解低质量标注样本的干扰。
消融实验
逐项添加PFOAPN与Wise-MPDIoU后,mAP50从90.0%提升至94.1%,证明二者协同增强模型性能。Grad-CAM热力图显示,PDC-DETR对病变区域的关注更集中,显著优于基线模型。
结论与意义
PDC-DETR通过并行化架构与动态损失函数设计,实现了黄斑变性检测精度与速度的平衡。其轻量化特性适配边缘设备与云端部署,有望推动基层医疗机构的自动化筛查应用,为眼科人工智能诊断树立新标杆。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号