一种基于小波增强反向注意力机制和定制颈部YOLO架构的高效结肠直肠息肉检测方法

《Biomedical Signal Processing and Control》:A channel-efficient colorectal polyp detection using wavelet-enhanced reverse attention and custom neck YOLO architecture

【字体: 时间:2026年02月19日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  基于YOLO的波let增强反向注意力模型提升结直肠癌息肉实时检测性能,在PolypGen等三组数据集上实现1.98%召回率提升,F2分数提高1.9%,并在RTX3060 GPU上达到100 FPS和10.11 ms平均延迟。

  
Nakshatra Basavaraj Sureban | Adithyan Chilangaliyath Ajish | Y. Abhinav | Manas Ranjan Prusty | Subhra Rani Patra
计算机科学与工程学院,维洛尔理工学院,印度金奈600127

摘要

结直肠癌是一个重大的公共卫生挑战,因此尽早发现它是当务之急。最初,传统的目标检测网络(如单阶段检测和快速循环卷积神经网络)被用于医学成像,但它们较高的计算开销降低了其在实时应用中的可行性。目前,单阶段模型因速度更快、结构更紧凑而更为普遍。基于此,提出的模型使用“你只看一次”(YOLO)算法进行息肉检测。新型模块“小波增强反向注意力”(WERA)结合自定义的YOLO架构,利用频率和空间域以及特征融合,提高了模型在通道效率。无锚点头部和混合精度策略使得模型更加轻量级。该模型在三个数据集上进行了测试,以验证其在不同环境下的可靠性和性能。进一步在综合数据集上进行测试,以检验其泛化能力。与YOLO11相比,该模型在Polypgen数据集上的召回率提高了1.98%,F2分数提高了1.9%,同时保持了精度。该模型在RTX3060 GPU上以100 FPS的速度运行,平均延迟为10.11毫秒。

引言

结直肠癌是全球发病率第三高、死亡率第二高的癌症类型[1]。尽管出现了多种新技术,但它仍然是一个需要解决的问题,因为2022年全球约有190万新病例和90万死亡病例[2]。当结肠内壁出现的异常生长(息肉)未得到治疗时,就会发展成结直肠癌。结肠镜筛查是检测结直肠癌最有效的方法之一,因为在筛查过程中,医生可以通过结肠镜发现并切除息肉,从而防止其进一步生长[3][4]。多项研究表明,结肠镜筛查可将结直肠癌的死亡率降低68%[5]。
腺瘤检测率(ADR)是评估结肠镜检查质量的主要指标之一,它反映了医生在常规筛查中识别出一个或多个癌前息肉的频率。通过结肠镜筛查早期发现并切除癌前息肉已被证明是现代医学中最有效的癌症预防策略之一。目前,临床实践中的结直肠息肉检测主要依赖于胃肠病学家的专业技能。虽然检测效果显著,但仍受医生经验、疲劳程度以及某些息肉特性等因素的影响,这些因素可能导致息肉被遗漏。鉴于上述局限性,越来越多地使用基于相关数据集训练的计算机视觉工具来提高诊断准确性。系统能够识别出最有可能含有息肉的区域,并向医生发出警报,从而帮助发现可能被忽略的息肉。这些系统通过相关数据集进行训练,以提高检测率。
尽管取得了这些进展,现有系统仍面临诸多挑战,影响其性能和准确性。目前的一个主要问题是许多现有模型的泛化能力有限,因为它们通常在小型、同质的数据集上进行训练。因此,当应用于具有不同人口统计学特征和不同成像条件的患者时,其性能会下降。另一个关键问题是这些息肉的外观可能多种多样。由于这些病变的大小、形状和纹理各不相同,因此难以一致地检测到它们。这种缺乏鲁棒性的问题使得它们在常规筛查中的可靠性较低,而准确检测各种息肉对于早期诊断和有效的结直肠癌预防至关重要。基于Transformer的方法最近变得流行起来,特别是DETR算法及其各种变体,标志着与传统基于卷积神经网络(CNN)的架构的分歧。
结肠息肉的大小各异,这增加了CNN模型在结肠镜检查过程中提取特征的难度。许多研究还表明,息肉越小,模型检测息肉的能力就越弱[6]。因此,多尺度问题是这类基于CNN的息肉检测方法面临的一个重大问题[7]。此外,基于CNN的模型和基于Transformer的模型计算成本较高,难以实时应用。本研究提出了一种新的自动化结直肠息肉检测方法,该方法针对内镜成像进行了优化。使用YOLO框架是因为其实时检测物体的能力和计算效率,为开发能够在常规结肠镜检查时间限制内运行的临床适用系统提供了理想基础。对基线YOLO架构进行了修改,以解决息肉检测过程中常见的挑战,如光照条件变化、组织纹理差异和息肉大小不一等问题。为了解决上述问题,开发了一个名为WERA的定制模块,该模块利用离散小波变换(DWT)创建特征图的低频版本,使注意力机制能够快速高效地工作,从而关注宏观模式和上下文,而忽略不必要的细节。小波抽象和反向注意力机制的结合使模型能够在关注关键细节的同时利用上下文信息。
架构中的“颈部组件”称为“顺序增强精细注意力”(SERA),它结合了来自三个主干阶段的特征图:初始Shallow-WERA的高分辨率浅层特征、第二个S-WERA的中间输出以及Deep-WERA块后的深度语义特征。它实现了信息的双向流动,将深层的语义上下文与浅层的信息精度融合在一起。这种方法能够更好地检测不同大小的息肉。在信息自上而下的流动过程中进行下采样,在自下而上的流动过程中进行上采样,从而利用该区域中的细节和广泛上下文线索。SERA结合了三重融合机制和策略性放置的注意力模块,以最大化特征细化和跨尺度信息共享。采用上述策略确保了语义和空间信息的稳健流动,同时保持了计算需求的可控性,生成了能够在多种临床和成像环境中提高物体检测准确性的多尺度特征图。
本研究的主要目的是评估所提出模型在多种数据集中检测结直肠息肉的性能,并评估其对临床实践的潜在影响。核心关注召回率指标,使模型在Polypgen数据集上的召回率达到95.15%。这些结果有助于模型满足临床场景中实时推理的要求。
总体而言,贡献总结如下:
  • WERA模块是一种基于反向注意力的模块,它在频率域中工作,有助于检测帧边缘和低对比度图像。
  • SERA是一种双向架构,利用跳跃连接为检测头部提供局部和全局上下文,并通过空间注意力进行增强
  • 本文的其余部分从第2节的文献综述开始,了解结直肠息肉检测的当前趋势,接着是第3节使用的数据集,第4节介绍所采用的方法论,第5节介绍训练环境,第6节展示结果,第7节讨论模型的结果和局限性以及未来发展方向,最后第8节得出结论。

    文献综述

    为了防止结直肠癌扩散,需要快速准确地识别息肉。如今,广泛使用基于人工智能(AI)技术的计算机辅助诊断系统来诊断医学图像[8][9]。常用的图像包括计算机断层扫描图像、内镜图像和胸部X光图像。首先收集现有的息肉数据集,然后对息肉图像数据进行处理

    数据集

    实验使用了三个数据集:PolypGen、CVC-ClinicDB和Kvasir。PolypGen数据集包含来自6家医疗机构的静态图像、视频序列、阳性帧和仅含阴性帧的帧[24]。模型仅使用了数据集中的阳性帧,忽略了阴性帧,因为它们通常会夸大模型的能力,不利于准确评估其性能。该数据集包含1,537个

    提出的方法论

    为了克服现有模型的局限性以及实时检测小型、低对比度息肉的挑战,提出的架构在现有基线YOLO模型的基础上进行了创新。该模型结合了定制设计的主干网络和颈部结构,相互补充,提高了上下文感知、多尺度特征融合和准确性。WERA是该模型的核心模块,用于提取丰富的特征

    实验设置

    本节概述了对模型进行的所有测试和实验,以比较其与现有模型的性能。设置描述了用于训练和测试的程序,实验程序还包括评估模型性能的评估指标。

    结果与讨论

    在多个数据集(包括CVC-ClinicDB、Kvasir和PolypGen)上进行了多项测试,以评估所提出架构的有效性和实时适用性。使用标准检测指标对模型进行了评估,并与现有的最先进模型进行了比较,重点关注召回率和F2分数,这些指标在临床应用中至关重要。此外,还进行了基于置信度的评估曲线和损失函数分析

    讨论

    本研究提出了一种新的目标检测YOLO模型,每个组件都经过专门设计,以实现实时检测结直肠息肉的平衡模型。开发了WERA模块,用于在频率域中为模型提供感知能力,使其更容易定位息肉边缘,并通过反向注意力模块进一步增强这一能力。设计了自定义的颈部架构,以提高空间域中的感知能力

    结论

    结直肠癌作为重大的公共卫生挑战,需要准确及时地检测息肉。本文旨在通过开发一种通道效率高的基于YOLO的架构来解决当前息肉检测系统中的不足,该架构结合了小波增强反向注意力(WERA)模块和自定义颈部架构。这使得模型能够利用空间和频率域的信息,从而更好地检测细微特征
    CRediT作者贡献声明
    Nakshatra Basavaraj Sureban: Adithyan Chilangaliyath Ajish: Y. Abhinav: Manas Ranjan Prusty: 写作——审稿与编辑、监督、项目管理、概念构思。 Subhra Rani Patra: 写作——审稿与编辑、验证、概念构思。
    利益冲突声明
    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
    致谢
    作者感谢维洛尔理工学院网络物理系统中心和计算机科学与工程学院提供了进行这项研究所需的环境和基础设施。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号