对于面部美貌分析而言,这些3D特性至关重要且无可替代
《The Knee》:Crucial and Irreplaceable 3D Features for Facial Beauty Analysis
【字体:
大
中
小
】
时间:2025年10月28日
来源:The Knee 1.6
编辑推荐:
针对多标注者医学图像分割中存在的计算冗余问题,本文提出了一种基于稀疏扩散的分割框架(SDSeg),通过背景自适应稀疏模块(BASS)加速推理,同时保持高分割精度。实验表明,在五个MRI和CT数据集上,该框架在效率和准确性上均优于现有方法。
杨吉|李浩峰|李冠斌|刘思琪|万翔
摘要
医学图像分割对于准确的医学诊断和治疗计划至关重要,但由于医学图像本身的复杂性和注释者之间的差异,这一过程常常存在不确定性。解决这一问题需要整合多位注释者的多样化见解。去噪扩散模型在预测多位专家的注释结果方面表现出优势,但这些模型的采样过程耗时较长。在本文中,我们提出了一种基于稀疏扩散的分割框架(SDSeg),旨在实现高效的多注释者医学图像分割,以在不同共识水平上生成分割结果。在该框架中,我们构建了一个背景自适应空间稀疏(BASS)模块,通过将计算资源集中在图像的关键区域来加速推理过程。该模块在保持高分割准确性的同时减少了采样时间。实验结果表明,与现有技术相比,我们的方法在五个不同的数据集上显著提高了分割的可靠性和效率。代码将在接受发表后通过以下链接发布:
https://github.com/lhaof/SparseDiffusion引言
医学图像的精确分割能够准确识别解剖结构,包括病变[1]、肿瘤[2]和器官[3,4],这对于获得可靠的医疗结果至关重要。通常,一组专家或注释者会独立地在图像中划定感兴趣的区域,从而为同一图像生成多个分割结果。医学图像的固有复杂性和不同注释者之间的差异往往导致分割结果的不确定性或模糊性[5]。这种模糊性限制了一般分割网络模型的应用,并使算法开发过程更加复杂。
为了解决多注释者医学图像分割的问题,常见的方法包括多数投票[6,7]或标签融合策略[8]。这些方法通过聚合各个注释者的标签来模拟他们之间的差异和一致性,从而探索多注释者分割的变异性和可靠性。然而,这些方法的分割精度有限。另一种方法旨在通过各种机制(如使用贝叶斯神经网络[9]或蒙特卡洛Dropout技术[10])来纳入不确定性,生成多个预测结果并对其进行平均,以克服确定性分割模型的局限性。尽管如此,这些技术可能会丢失关键信息,并且缺乏足够的表示能力。
最近,去噪扩散概率模型(DDPM)[11]在各种计算机视觉任务中表现出卓越的性能,它们通过模拟逐步向图像添加噪声的过程并随后学习逆转这一过程来工作。扩散模型的进步展示了其在图像分割领域的巨大潜力[[12], [13], [14], [15], [16]]。一些最近的研究[[17], [18], [19]]验证了扩散模型在多注释者医学图像分割中的有效性。然而,这些模型的分割过程效率低下且耗时较长,因为生成单一输出需要多次前向传播。
我们观察到,医学图像中的感兴趣区域通常只占整个图像的一小部分。在推理过程中,大多数背景区域的特征计算可能是多余的。为了减少单个样本的采样时间,我们开发了一个基于稀疏扩散的分割框架(SDSeg),用于处理多注释者医学图像分割。SDSeg框架整合了两个子网络:Prior Net和Denoising Net。Prior Net根据多位评分者的注释平均值生成软掩码,并将特征引入另一个子网络。Denoising Net通过一系列迭代去噪步骤生成不同共识水平的分割掩码。c级共识掩码是指至少有c位注释者达成一致的前景像素的分割掩码。在Denoising Net中,我们设计了一个背景自适应空间稀疏(BASS)模块,该模块消除了处理大部分背景或非活动图像块的需要。在推理阶段,BASS模块可以直接替换Denoising Net的解码器层而无需重新训练,从而实现更快的分割。
总之,我们的工作有三个主要贡献:
•我们基于医学图像中稀疏感兴趣区域(ROIs)设计了一个高效的基于稀疏扩散的分割框架,加速了分割过程的同时保持了高性能。
•我们提出了一个背景自适应空间稀疏(BASS)模块,主要用于处理前景区域特征,并在推理阶段加速了所提出的分割框架。
•我们在五个多注释者的MRI(磁共振成像)和CT(计算机断层扫描)数据集上验证了我们提出方法的有效性,这些数据集涵盖了四个不同的解剖区域。所提出的框架以更高的效率实现了最先进的分割结果。
章节摘录
多注释者医学图像分割
深度学习模型在自动化医学图像分割方面取得了显著的成功[[20], [21], [22], [23], [24], [25]]。早期的工作[26]通常使用具有单一融合掩码的确定性模型作为真实值,未能充分利用多个注释中的不确定性。为了解决这个问题,引入了贝叶斯神经网络[9,27]和Dropout技术[10],通过学习网络权重的分布或在过程中引入随机性来模拟不确定性
问题定义
多注释者医学图像分割的任务涉及N位专家注释者独立识别和标记同一图像中的各种结构或病理模式,其中H、W和C分别代表图像的高度、宽度和通道数。对于每张图像,标记过程会产生一系列多样化的分割注释,反映了不同N位专家对图像内容的不同理解和解释。
网络架构
数据集
所提出的框架使用来自“生物医学图像不确定性量化(QUBIQ)挑战”[52]^2的数据进行评估。该挑战包括五个涉及四个不同解剖区域的MRI和CT图像数据集。每个数据集都关注与特定病理或健康解剖结构相关的二值分割任务,并由多位专家进行注释,以提供专业的分割结果。这些数据集包括肾脏分割
结论
在本文中,我们提出了一种基于稀疏扩散的分割框架(SDSeg),用于多注释者医学图像分割,解决了输入图像背景区域中冗余特征计算的问题。所提出的框架整合了一个Prior Net来提供初始的分割估计,以及一个Denoising Net来生成不同共识水平的分割掩码。我们还开发了一个新颖的背景自适应空间稀疏(BASS)模块
CRediT作者贡献声明
杨吉:撰写——原始草稿、方法论、形式分析、概念化。李浩峰:撰写——审稿与编辑、项目管理、方法论、数据管理、概念化。李冠斌:撰写——审稿与编辑、监督、形式分析。刘思琪:撰写——审稿与编辑、形式分析、数据管理。万翔:撰写——审稿与编辑、数据管理、概念化。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号