《SLAS Technology》:Identification of pathological secretions in bronchoscopic images based on edge features and multi-scale attention mechanism
编辑推荐:
病理支气管分泌物的积累会损害危重患者的通气和氧合,严重时可能导致肺不张或继发感染,因此在重症监护和手术麻醉期间及时识别和清除病理分泌物至关重要。传统的手动支气管镜评估严重依赖操作者经验,缺乏实时可靠性,无法满足高效精准干预的临床需求。为解决这一局限性,本研究提
病理支气管分泌物的积累会损害危重患者的通气和氧合,严重时可能导致肺不张或继发感染,因此在重症监护和手术麻醉期间及时识别和清除病理分泌物至关重要。传统的手动支气管镜评估严重依赖操作者经验,缺乏实时可靠性,无法满足高效精准干预的临床需求。为解决这一局限性,本研究提出了一种基于Canny边缘特征的边缘感知双尺度Transformer(Edge-Aware Dual-Scale Transformer,EADST),用于智能化和自动化的支气管分泌物识别。研究人员对50名重症肺炎患者的支气管镜图像数据(包括正常生理和病理分泌物)进行灰度增强和Canny边缘检测预处理,以生成分泌物区域的结构表示;随后通过补丁嵌入模块进行边缘感知特征映射,通过双尺度注意力模块捕捉全局语义和局部结构依赖性,通过边缘感知前馈网络自适应增强关键通道,最后由后端分类头进行实时病理分泌物判别。所有实验在统一的Canny特征表示下进行,并将所提出的框架与多个经典最先进(state-of-the-art,SOTA)模型(包括VGG-16、ResNet-50、EfficientNet、MobileNet和Vision Transformer(ViT))进行了比较。实验结果表明,EADST在边缘衍生特征上的病理分泌物识别达到了优异的准确率(89.2%)和鲁棒性,表明注意力驱动和边缘自适应特征建模有效增强了支气管镜视觉感知,并为智能、实时的支气管镜病理分泌物抽吸决策支持系统提供了有前景的基础。
支气管镜图像中病理分泌物的自动化识别是气道管理智能化的关键一环。在重症监护和麻醉手术等场景下,分泌物堆积常引发通气障碍、肺不张甚至继发感染,而传统依赖操作者经验的手动评估方式缺乏实时性与客观性,难以满足临床精准干预需求。为突破这一瓶颈,研究人员提出了基于边缘特征与多尺度注意力的EADST(Edge-Aware Dual-Scale Transformer)框架,利用Canny边缘检测提取的结构化表示,结合注意力机制实现高准确率识别。该研究收集了来自大连大学附属中山医院神经重症监护室(NICU)50名重症肺炎患者的支气管镜图像,涵盖病理与正常分泌物,并包含支气管镜体干扰等视觉变异,共184幅样本。论文发表于《SLAS Technology》,为智能吸痰决策系统提供了可行方案。
为实现高效识别,研究人员主要采用以下关键技术方法:首先通过Canny边缘检测算子对灰度增强后的图像提取边缘特征图,突出分泌物与组织的边界形态;其次构建边缘感知补丁嵌入模块(Edge-Aware Patch Embedding,EAPE),将边缘图分割为局部令牌并投影至潜在空间;然后设计双尺度注意力模块(Dual-Scale Attention,DSA),并行运算局部窗口自注意力和全局自注意力,分别捕捉细粒度边界结构和大范围空间依赖;最后引入边缘感知前馈网络(Edge-Aware Feed-Forward Network,Edge-aware FFN),通过自适应信道重加权增强关键边缘通道,并采用残差连接稳定特征。所有实验在同一Canny特征表示下进行五折交叉验证,对比模型包括VGG-16、ResNet-50、EfficientNet、MobileNet及Vision Transformer(ViT)。
研究结果部分详述如下:
3.1 Classic SOTA model classification result:通过五折交叉验证评估经典模型,EfficientNet以83.7%准确率领先,其复合缩放策略有效适配边缘特征;MobileNet以82.4%准确率次之,敏感性达87.1%,显示深度可分离卷积对分泌物边缘变化的敏感性;ResNet-50准确率74.9%,VGG-16仅66.7%,ViT因缺乏纹理色彩仅达59.3%。结果表明,具有结构稀疏适应性的轻量模型在边缘特征上表现更优。
3.2 EADST classification result:EADST达到89.2%准确率、87.1%特异性和89.8%敏感性,优于所有基线。消融实验证实各组件贡献:以灰度图代替Canny特征(EADST-G)准确率降至63.3%;移除局部注意力分支(EADST-A)降至81.6%;用标准FFN替代Edge-aware FFN(EADST-F)降至85.7%,证明边缘特征、双尺度注意力和自适应增强模块的协同效应。
3.3 Feature map visualization:可视化分类层前的高层特征图显示,EADST的激活区域集中于病理分泌物边界和形态结构,背景抑制明显;而CNN与ViT模型激活分布广泛,受非判别性区域影响,进一步验证了边缘感知与注意力机制的有效性。
讨论部分总结了模型参数规模与识别性能的关系。Canny边缘特征使输入稀疏化,大容量网络(ResNet-50 24.11M参数、VGG-16 23.10M、ViT 85.80M)未能充分利用,准确率反而低于轻量级EfficientNet(4.05M)和MobileNet(3.23M)。EADST仅0.78M参数即实现最优性能,表明结构边界为主要判别信息时,轻量级结构感知架构比大规模网络更具兼容性和应用潜力。研究结论指出:EADST在边缘衍生特征上实现了89.2%的病理分泌物识别准确率,证明注意力驱动与边缘自适应特征建模可有效增强支气管镜视觉感知,为智能、实时的支气管镜病理分泌物抽吸决策支持系统提供了可靠基础。