ESD-VesNet：基于困难负样本挖掘的感知不确定性内镜黏膜下剥离术中血管分割网络

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《International Journal of Computer Assisted Radiology and Surgery》：ESD-VesNet: uncertainty-aware vessel segmentation network for endoscopic submucosal dissection with hard negative mining

【字体：大中小】 时间：2026年07月04日 来源：International Journal of Computer Assisted Radiology and Surgery 2.8

编辑推荐：

　　目的：预防内镜黏膜下剥离术（ESD）中的术中出血依赖于及时识别和预先凝固黏膜下血管。研究人员旨在通过提供具有不确定性感知能力的准确血管分割来降低出血风险。方法：本研究提出ESD-VesNet，一种基于无提示SAM3（Segment Anything Model

目的：预防内镜黏膜下剥离术（ESD）中的术中出血依赖于及时识别和预先凝固黏膜下血管。研究人员旨在通过提供具有不确定性感知能力的准确血管分割来降低出血风险。方法：本研究提出ESD-VesNet，一种基于无提示SAM3（Segment Anything Model 3）的框架，配备证据头（evidential head）以输出血管概率和像素级不确定性。该模型采用假阳性感知方式训练，使用研究人员构建的ESD-Vessel数据集，包含2401例阳性样本（具有清晰血管标注的图像）和708例精选困难负样本（视觉上可能与血管混淆的图像），并结合在线不确定性引导的困难负样本挖掘。通过抑制假阳性预测，该方法有望减少不必要的干预，如无依据的凝固操作。结果：在验证集上，ESD-VesNet实现前景Dice系数（Dice_FG）52.11%、前景交并比（IoU_FG）35.23%、平均Dice系数（mDice）75.70%和血管检出率（VDR）96.81%，同时将背景假阳性率（BG_FPR）控制在0.61%。结构质量指标表现优异（E-measure 0.7275；S-measure 0.7223）。定性分析显示该方法在气泡、碎屑、反光和渗血等干扰条件下具有稳健性。结论：将SAM3与证据不确定性及困难负样本挖掘相结合，构建出一种面向临床的血管分割系统，在保持高检出敏感性的同时实现低假阳性率，为更安全的ESD提供支持。

## 研究背景与问题

内镜黏膜下剥离术（Endoscopic Submucosal Dissection, ESD）是早期消化道肿瘤的微创治疗方案，具有创伤小、术后恢复快的优势。然而，该手术操作高度复杂，尤其因黏膜下层血管结构错综复杂，在剥离过程中构成重大安全挑战。使用高频电刀进行组织切开时，若未能预先识别隐匿血管，机械切割与电热效应可导致血管破裂引发术中出血。作为ESD的主要并发症，术中出血不仅遮蔽手术视野、需要反复冲洗寻找出血点，还可能延长手术时间，严重时需中转开放手术，显著增加患者风险。目前，出血相关研究多聚焦于出血后的处置，如出血检测与动态出血源定位，而本研究强调通过早期血管区域预警与及时干预来实现出血预防。临床中，医师在切开前对可疑血管进行预凝固处理，但该操作高度依赖医师对血管的识别能力。研究表明约20%的术中不良事件源于人眼视觉感知错误，包括解剖结构误判；在无计算辅助条件下，内镜医师的平均血管检出率（Vessel Detection Rate, VDR）仅约56.4%。因此，人工智能辅助的实时血管检测与分割对提升手术安全性具有重要临床价值。

尽管计算机视觉在医学图像分割领域取得显著进展，ESD环境下的血管分割仍面临严峻挑战。第一，黏膜下血管的纹理、色泽与周围黏膜组织高度相似，边界模糊，传统算法难以实现精确边缘检测。第二，ESD手术环境高度动态，气泡、组织碎屑、烟雾及轻微渗血造成的视觉遮挡和图像伪影频繁触发算法的假阴性或假阳性。这些挑战需要能够同时处理血管形态细微特征与ESD环境噪声特性的专门方法。

## 研究设计与核心结论

为应对上述挑战，本研究提出ESD-VesNet框架，基于SAM3（Segment Anything Model 3）基础模型构建，融入不确定性感知学习。主要贡献包括：构建ESD-Vessel数据集，涵盖44例高清手术视频的2401帧血管标注图像和708帧困难负样本图像，据研究团队所知这是首个明确纳入负样本以抑制训练过程假阳性的ESD血管数据集；提出ESD-VesNet框架，通过整合证据深度学习（Evidential Deep Learning, EDL）进行不确定性量化与困难负样本挖掘，在保持高血管检出率与低假阳性率的同时实现优质分割。

## 关键技术方法

研究数据来源为山东大学齐鲁医院44例高清ESD视频，覆盖食管、贲门、胃体、胃小弯、胃窦、十二指肠、乙状结肠及升结肠8个解剖部位，视频以30帧/秒录制，分辨率1920×1080。研究侧重获取预凝固与黏膜下剥离阶段的手术片段，以1帧/秒的采样率提取关键帧共11921帧，经内镜专家筛选标注后最终形成3109帧数据集，含2401帧阳性样本与708帧困难负样本。数据按患者层面划分为训练集（2764帧）与验证集（345帧），确保无患者重叠。

技术架构层面，ESD-VesNet包含三个模块：SAM3 ViTDet图像编码器（主干+颈部）、无提示SAM解码器（提示编码器+掩码解码器）、以及证据学习头。SAM3主干将输入图像处理为72×72的令牌网格，颈部生成多尺度特征金字塔{P2, P3, P4, P5}，以P4作为主要图像嵌入用于掩码解码。无提示设置通过向提示编码器输入空提示实现。证据学习头将双类别对数几率映射为狄利克雷参数α，进而获取血管概率p_vessel和不确定性u = K/Σα_k，并引入不确定性门控概率p_gated = p_vessel·(1-u)^γ以抑制不确定区域的假阳性。

训练采用假阳性感知策略，以固定正负样本比例构建小批量，负样本优先从动态维护的困难池中抽取。损失函数组合证据深度学习的目标（含退火KL正则项的类别期望误差）与辅助软Dice约束。在线困难负样本挖掘策略通过结合前景面积比率与置信度项(1-?(x))量化样本困难度，每轮更新Top-K困难样本池。

实验基于PyTorch 2.4.0实现，采用3块NVIDIA GeForce RTX 3090 GPU分布式训练100轮，学习率2×10^-4，输入尺寸1024×1024。困难负样本挖掘维护500样本池，每轮扫描600候选样本更新，困难负样本采样概率0.5。

## 研究结果

### 定量比较

表3展示了ESD-VesNet与多种代表性分割基线方法的验证集性能比较，涵盖分割精度、假阳性控制及结构质量指标。

DeepLabV3+实现最高血管检出率97.39%，显示强敏感性，但代价为高假阳性率（BG_FPR: 8.23%）和低分割精确率（Prec_FG: 12.34%），存在显著过度 rooted in 过度分割。nnU-Net显著降低假阳性（1.27%）但检出率偏低（83.58%），未能实现临床安全所需的灵敏度和特异性平衡。TransUNet作为高竞争力基线，取得较优分割结果（Dice_FG: 50.36%, mDice: 74.83%），有效平衡敏感性与特异性。ESD-VesNet在所有关键维度超越TransUNet：实现最高分割精度（Dice_FG: 52.11%, mDice: 75.70%）和交并比（IoU_FG: 35.23%）；血管检出率达96.81%（仅次于过度分割的DeepLabV3+），同时保持0.61%的低背景假阳性率；结构对齐指标最优（E_φ: 0.7223），表明模型不仅分割更多血管像素，且更好保持血管拓扑结构与边界细节。结果验证了SAM3与不确定性引导证据学习及困难负样本挖掘结合的设计，成功抑制背景噪声而不牺牲对细微隐匿血管的检出敏感性。

### 解剖部位泛化分析

按解剖部位的验证性能分析显示（表4），因验证集仅包含胃窦、食管、胃体三个部位样本，部位特异性量化受限于此三者。

### 定性比较可视化

可视化结果揭示不同手术场景下的性能模式：清晰血管暴露场景中，各方法均取得合理分割质量，而ESD-VesNet呈现更优边界精度与完整性；气泡或组织碎屑部分遮挡场景，基线方法性能显著下降，U-Net和DeepLabV3+产生碎片化预测，TransUNet连续性改善但仍存边界不准确；极端干扰场景（镜面反光与渗血）下，传统方法产生大量假阳性，将黏膜褶皱和出血区域误判为血管，ESD-VesNet则有效抑制假阳性检测，同时保持对真实血管结构的敏感性。不确定性引导门控机制在区分易混淆组织模式与真实血管方面尤为有效。原始SAM及无提示SAM变体虽具强特征提取能力，但缺乏ESD环境的领域优化；证据学习头与不确定性引导困难负样本挖掘的整合显著增强对ESD动态噪声模式的稳健性，在解剖学不合理区域呈现更清洁的预测。

## 讨论与结论

黏膜下血管的精确分割对安全实施ESD至关重要。本研究提出的ESD-VesNet框架将SAM3基础模型能力与证据不确定性量化、假阳性感知训练及困难负样本挖掘整合，在具有挑战性的术中条件下检测细小、隐匿血管的同时保持低假阳性率。核心贡献包括：ESD-Vessel数据集（3109帧含血管标注和精选困难负样本）填补了手术人工智能基准的关键空白；配备像素级不确定性估计证据头的无提示SAM3架构；以及动态识别并优先处理训练过程中困难假阳性模式的不确定性引导困难负样本挖掘策略。

验证结果表明，ESD-VesNet实现Dice_FG 52.11%、VDR 96.81%和BG_FPR 0.61%，在敏感性和特异性平衡方面显著优于现有方法。该框架对气泡、碎屑、反光和渗血的稳健性使其成为预凝固引导的有用工具，有望减少ESD术中出血并发症并改善患者安全。未来工作应聚焦多中心验证、视频检测的时间建模、与实时手术引导系统的整合，以及探索适合边缘部署的轻量架构和纳入多模态信息（如窄带成像）以进一步增强临床效用。

研究结论：内镜黏膜下剥离术中黏c膜下血管精准分割对保障手术安全具有关键意义。本研究所提出的ESD-VesNet为面向该手术场景的血管分割框架。该方法通过整合SAM3基础模型、证据不确定性量化技术以及融合困难负样本挖掘的假阳性感知训练策略，成功在极具挑战性的术中条件下，于细小且隐匿的血管检测与维持低假阳性率之间达成优越平衡。研究核心贡献涵盖：构建包含3109帧图像及精选困难负样本的ESD-Vessel数据集，弥补当前手术人工智能领域基准数据的关键缺失；设计由证据学习头增强的无提示SAM3架构以实现像素级不确定性估计；以及提出能够动态识别并优先处理复杂假阳性模式的不确定性引导在线困难负样本挖掘机制。验证集实验证实，ESD-VesNet获得了Dice_FG 52.11%、血管检出率96.81%及背景假阳性率0.61%的优异表现，在敏感性与特异性平衡方面显著超越现有技术。该框架针对气泡干扰、组织碎屑、镜面反光及血液渗漏等复杂场景展现出良好的鲁棒性，在临床预凝固指导中具有应用价值，有望降低术中出血并发症风险并提升患者安全水平。未来研究方向应包括开展多中心临床验证、探索视频序列的时间建模方法、推进与实时手术导航系统的整合，同时可考虑开发适配边缘计算部署的轻量化模型架构，并进一步融合窄带成像等多模态信息以增强临床适用性。

联系信箱：

粤ICP备09063491号

热点排行