EAGLE-Net:基于分层神经网络的上消化道内窥镜解剖标志点检测及其临床诊断应用

【字体: 时间:2025年09月21日 来源:Healthcare and Rehabilitation

编辑推荐:

  本研究针对上消化道内窥镜视频中因噪声和污染物体导致的图像质量下降问题,提出了一种名为EAGLE-Net的分层神经网络架构。该网络通过图像质量评估和解剖标志点分类两阶段处理,集成注意力模块和分层交叉熵损失函数,在十类解剖标志点分类任务中达到93%的平均准确率,显著提升了内窥镜检查过程的自动化水平和诊断效率,为计算机辅助诊断系统的实际部署提供了重要技术支撑。

  

在上消化道内窥镜检查中,准确识别解剖标志点对病变检测、诊断一致性和治疗计划制定具有关键作用。然而,传统方法主要针对静态图像进行标注,而临床实践中更常见的是视频流数据。这些视频常受到运动模糊、光照不稳定、液体、气泡、血液、蒸汽以及医疗器械等污染物的干扰,导致图像质量显著下降,直接影响深度学习模型的判断准确性。欧洲胃肠内窥镜学会(ESGE)建议每次上消化道内窥镜检查应至少观察10个解剖标志点,但目前大多数研究仍局限于单一任务分类,缺乏对视频流中噪声因素的系统处理和多任务协同学习框架。

为解决这一问题,来自越南科学技术大学(Hanoi University of Science and Technology)的Thi Thu Huong Nguyen等研究人员在《Healthcare and Rehabilitation》上发表了一项研究,提出了一种名为EAGLE-Net(hiErarchical network for Anatomical landmark detection in GastrointestinaL Endoscopy)的分层神经网络架构。该网络能够同时完成图像质量筛选和解剖标志点分类两项任务,显著提升了在真实临床环境中的适用性和分类精度。

研究人员构建了一个名为IGH-Endo的数据集,包含从内窥镜视频中提取的静态图像和完整视频数据。静态图像部分涵盖10个解剖标志点,并包含四种光照模式(WLI、FICE、BLI、LCI),同时区分了信息帧和非信息帧(如模糊、泡沫、暗光等)。视频数据部分则用于模型在真实临床环境下的性能验证。研究采用MobileNet-V3作为主干网络,设计了包含共享层、粗分支(图像质量分类)、注意力模块和细分支(解剖标志点分类)的分层结构,并引入了分层交叉熵损失函数(HXE)和焦点损失(Focal Loss)以应对数据不平衡和层次结构问题。

关键技术方法包括:使用分层神经网络架构实现多任务学习;引入注意力机制增强特征连接;提出分层交叉熵损失函数优化层次间一致性;采用MobileNet-V3作为轻量化主干网络以支持实时部署;构建包含10个解剖标志点和4类噪声标签的临床数据集。

4.1. Training EAGLE-NET model

通过超参数调优和五折交叉验证,研究确定批量大小为16,训练轮次为100,使用SGD优化器。在不同骨干网络对比中,MobileNet-Large在参数量、计算效率和推理速度方面表现最优,最终被选为EAGLE-Net的主干网络。

4.2. Evaluation metrics

采用准确率、精确率、召回率和F1分数等指标对模型进行综合评估。粗分支关注信息帧与非信息帧的二分类问题,细分支则针对10个解剖标志点和4类噪声因素进行细粒度分类。

4.3. Ablation study

通过消融实验验证了注意力模块和分层损失函数的有效性。结果显示,引入注意力模块后平均精确率提升3.16%,F1分数提高2.47%;结合分层交叉熵损失函数后,性能进一步提升,其中α=0.6时模型达到最佳性能(F1-score=93.38%)。

4.4. Evaluations the proposed model EAGLE-Net

与ResNet-18、MobileNet和EfficientNet等基线模型相比,EAGLE-Net在多项指标上均显著优于对比模型,尤其在处理含噪声数据时表现出更强的鲁棒性。独立测试集上的混淆矩阵分析显示,模型对大多数解剖标志点具有高识别精度,仅在胃窦和较小弯曲区域存在一定误判。

4.5. Experiments results with clinical video data

在11段临床视频数据上的测试表明,EAGLE-Net在食管、贲门、胃底等部位实现了100%的识别准确率,但在咽部和胃窦区域仍存在一定误差。总体召回率达到98%,精确率为93%,证实了模型在真实临床场景中的有效性。

研究结论表明,EAGLE-Net通过分层架构和注意力机制有效解决了内窥镜视频中的噪声问题,显著提升了解剖标志点的分类精度。该模型在保持高准确性的同时实现了实时处理能力,为计算机辅助诊断系统的临床应用提供了可靠技术基础。讨论部分指出,当前模型在咽部等特定区域的识别性能仍有提升空间,未来需要通过多中心数据采集和增强数据多样性进一步优化模型泛化能力。此外,研究建议在未来工作中扩展Transformer等先进架构的对比实验,并加强对边缘设备部署性能的全面评估。

这项研究不仅推动了内窥镜影像分析技术的发展,也为实现智能化、自动化的消化道疾病诊断系统奠定了重要基础,具有显著的临床意义和应用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号