用于多注释者医学图像分割的稀疏扩散模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

用于多注释者医学图像分割的稀疏扩散模型

《The Knee》：Sparse Diffusion Models for Multi-annotator Medical Image Segmentation

【字体：大中小】 时间：2025年10月28日 来源：The Knee 1.6

编辑推荐：

　　多标注者医学图像分割存在冗余计算问题，本文提出基于稀疏扩散模型的SDSeg框架，通过BASS模块聚焦前景区域，减少采样时间同时保持高精度，在五个MRI/CT数据集上验证有效性。

杨姬|李浩峰|李冠斌|刘思琪|万翔

摘要

医学图像分割对于准确的医学诊断和治疗计划至关重要，但由于医学图像的固有复杂性和注释者之间的差异性，这一过程常常存在不确定性。为了解决这个问题，需要捕捉并整合多个注释者的不同见解。去噪扩散模型在预测多位专家的注释方面表现出优势。然而，这些模型的采样过程耗时较长。在本文中，我们提出了一种基于稀疏扩散的分割框架（SDSeg），用于高效的多注释者医学图像分割，旨在生成不同一致性水平下的共识掩码。在所提出的框架中，我们构建了一个背景自适应空间稀疏（BASS）模块，通过将计算资源集中在图像的关键区域来加速推理过程。该模块在保持高分割准确性的同时减少了采样时间。实验结果证明了我们的方法在五个不同数据集上的有效性，与现有技术相比，在分割可靠性和效率方面均有显著提升。代码将在接受发表后通过https://github.com/lhaof/SparseDiffusion发布。

引言

医学图像的精确分割能够准确识别解剖结构，包括病变[1]、肿瘤[2]和器官[3,4]，这对于实现可靠的医学结果至关重要。通常，一组专家或注释者会独立地在图像中勾画出感兴趣的区域，为同一图像生成多个分割结果。医学图像的固有复杂性和不同注释者之间的差异性往往导致分割结果的不确定性或模糊性[5]。这种模糊性限制了一般分割网络模型的适用性，并使算法开发过程变得更加复杂。

为了解决医学图像分割的多注释者预测问题，常见的方法包括多数投票[6,7]或标签融合策略[8]。这些方法通过聚合各个注释者的标签来模拟他们之间的差异和一致性，从而探索多注释者分割的变异性和可靠性。然而，这些方法的分割精度有限。其他方法试图通过各种机制（如使用贝叶斯神经网络[9]或蒙特卡洛Dropout技术[10]）来克服确定性分割模型的局限性，从而产生多个预测结果并进行平均。尽管如此，这些技术可能会丢失关键信息，并且缺乏足够的表示能力。

最近，去噪扩散概率模型（DDPM）[11]在各种计算机视觉任务中表现出色，它们通过模拟逐步向图像添加噪声的过程，然后学习逆转这一过程。扩散模型的进步展示了其在图像分割领域的巨大潜力[[12], [13], [14], [15], [16]]。一些最新研究[[17], [18], [19]]验证了扩散模型在多注释者医学图像分割中的有效性。然而，这些模型的分割过程效率低下且耗时较长，因为生成单个输出需要多次前向传播。

我们观察到，医学图像中的感兴趣区域通常只占整个图像的一小部分。在推理过程中，大多数背景区域的特征计算可能是多余的。为了减少单个样本的采样时间，我们开发了一个基于稀疏扩散的分割框架（SDSeg）来处理多注释者医学图像分割。SDSeg框架整合了两个子网络：先验网络（Prior Net）和去噪网络（Denoising Net）。先验网络根据多位注释者的平均注释生成软掩码，并将特征引入另一个子网络。去噪网络通过一系列迭代去噪步骤生成不同一致性水平的共识掩码。c级共识掩码是指至少有c位注释者同意的前景像素的分割掩码。在去噪网络中，我们设计了一个背景自适应空间稀疏（BASS）模块，该模块消除了处理大部分背景或非活动图像块的需要。在推理阶段，这个BASS模块可以直接替换去噪网络的解码器层而无需重新训练，从而实现更快的分割。

总之，我们的工作有三个主要贡献：

•

我们基于医学图像中稀疏的感兴趣区域（ROIs）设计了一个高效的基于稀疏扩散的分割框架，加快了分割过程的同时保持了高性能。

•

我们提出了一个背景自适应空间稀疏（BASS）模块，主要用于处理前景区域特征，并在推理阶段加速了所提出的分割框架。

•

我们在五个多注释者的MRI（磁共振成像）和CT（计算机断层扫描）数据集上验证了我们提出方法的有效性，涵盖了四个不同的解剖区域。所提出的框架以更高的效率实现了最先进的分割结果。

章节摘录

多注释者医学图像分割

深度学习模型在自动医学图像分割方面取得了显著的成功[[20], [21], [22], [23], [24], [25]]。早期的工作[26]通常使用具有单一融合掩码的确定性模型作为真实值，未能充分利用多个注释中的不确定性。为了解决这个问题，引入了贝叶斯神经网络[9,27]和Dropout技术[10]，通过学习网络权重的分布或在过程中引入随机性来模拟不确定性

问题定义

多注释者医学图像分割的任务涉及N位专家注释者独立识别和标记同一图像中的各种结构或病理模式

I \in R^{H \times W \times C}

，其中H、W和C分别代表图像的高度、宽度和通道数。对于每张图像，标记过程产生一系列不同的分割注释

{M_{i}}_{i = 1}^{N}

，反映了不同N位专家对图像内容的不同理解和解释。

网络架构

数据集

所提出的框架使用了来自“生物医学图像不确定性量化（QUBIQ）挑战赛”[52]^2的数据进行评估。该挑战赛包括五个MRI和CT图像数据集，涵盖四个不同的解剖区域。每个数据集都关注与特定病理或健康解剖结构相关的二值分割任务，并由多位专家进行注释，以提供专业的分割结果。这些数据集包括肾脏分割

结论

在本文中，我们提出了一种高效的基于稀疏扩散的分割框架（SDSeg），用于多注释者医学图像分割，解决了输入图像背景区域中冗余特征计算的问题。所提出的框架整合了先验网络（Prior Net）来提供初始的分割估计，以及去噪网络（Denoising Net）来生成不同一致性水平的多个分割掩码。我们还开发了一个新颖的背景自适应空间稀疏（BASS）模块

未引用的参考文献

[30]

CRediT作者贡献声明

杨姬：撰写——原始草案、方法论、形式分析、概念化。李浩峰：撰写——审阅与编辑、项目管理、方法论、数据管理、概念化。李冠斌：撰写——审阅与编辑、监督、形式分析。刘思琪：撰写——审阅与编辑、形式分析、数据管理。万翔：撰写——审阅与编辑、数据管理、概念化。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号