基于改进RT-DETR的胃肠息肉实时检测方法:多尺度特征融合与注意力机制优化

《Scientific Reports》:Gastrointestinal polyp detection method based on the improved RT-DETR

【字体: 时间:2026年02月04日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对胃肠息肉形态多变、尺度失衡及成像噪声导致的漏检难题,基于RT-DETR-r18架构提出一种实时检测框架。通过引入DWRC3-DRB模块增强深浅特征融合,设计EAAAIFI模块抑制背景干扰,结合ELA-HSFPN实现多尺度特征自适应整合。实验表明,该方法在混合内镜数据集上将精确度提升至94.8%,召回率达89.9%,mAP@0.5提高至94.2%,并以188.6 FPS的速率满足实时诊断需求,为结直肠癌早期筛查提供关键技术支撑。

  
胃肠息肉是结直肠癌的重要癌前病变,早期发现并切除可显著降低癌症死亡率。目前临床主要依赖内镜医师肉眼观察进行诊断,但息肉形态大小不一、表面纹理复杂,加之肠道蠕动、黏液干扰等因素,导致漏诊率高达22%-28%。传统计算机辅助检测系统虽能提升效率,却难以平衡精度与速度:卷积神经网络(CNN)模型对小尺度息肉敏感度不足,Transformer架构计算开销大,无法满足内镜实时视频流处理需求。
为攻克这一难题,研究团队以RT-DETR-r18(Real-Time Detection Transformer)为基线模型,通过三重创新模块构建高效轻量化的检测框架。DWRC3-DRB(Dense Weighted Residual C3 with Dense Residual Block)模块通过残差连接与密集跳层融合,强化浅层细节特征(如息肉边缘)与深层语义特征的协同表达;EAAAIFI(Efficient Adaptive Attention with Linear Complexity)模块以线性计算成本实现全局上下文建模,有效抑制肠道褶皱、气泡等背景噪声;ELA-HSFPN(Efficient Local Attention with Hierarchical Scale Feature Pyramid Network)则引入局部注意力机制与分层特征金字塔,自适应融合多尺度息肉特征。
关键技术方法
研究基于混合内镜数据集(包含公开数据集与临床采集数据),采用改进的RT-DETR架构。首先利用DWRC3-DRB模块替换基线中的C2f模块,增强特征复用能力;随后在编码器部分嵌入EAAAIFI模块,通过线性注意力机制优化长序列建模;最后通过ELA-HSFPN重构特征金字塔,实现跨尺度特征交互。模型训练采用动态标签分配策略与损失函数优化,在保持188.6 FPS实时速度的同时提升检测鲁棒性。
实验结果分析
消融实验验证模块有效性
逐项添加DWRC3-DRB、EAAAIFI和ELA-HSFPN模块后,模型mAP@0.5分别提升1.2%、1.8%和1.0%,证实各模块对特征提取、噪声抑制与多尺度融合的贡献具有累加效应。
与主流检测器性能对比
在相同数据集上,本研究方法相较YOLOv8、DETR等模型,对小尺度息肉(直径<5mm)的召回率提高12.3%,对扁平型息肉的检测精度提升9.7%,且参数量降低18.4%。
实时性测试
在RTX 3090显卡的部署环境中,模型处理单帧图像仅需5.3ms,显著优于Swin-Transformer(28.6ms)等基于自注意力的模型,满足临床实时诊断的延迟要求(≤30ms)。
讨论与结论
该研究通过模块化改进RT-DETR架构,实现了精度与速度的协同优化。DWRC3-DRB模块通过密集连接缓解梯度消失,提升特征复用效率;EAAAIFI模块以线性复杂度替代标准自注意力,在降低计算负担的同时保持全局感知能力;ELA-HSFPN通过局部注意力权重动态调整多尺度特征贡献,有效解决息肉尺度失衡问题。值得注意的是,该方法对粘连息肉、缺血性息肉等复杂场景仍存在误检,未来需引入形状先验知识或3D空间信息进一步优化。该成果发表于《Scientific Reports》,为内镜AI辅助诊断系统提供了可落地的技术方案,对结直肠癌早筛的普及化具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号