预处理技术对深度学习乳腺图像分割性能影响的系统评估
《Scientific Reports》:The impact of pre-processing techniques on deep learning breast image segmentation
【字体:
大
中
小
】
时间:2025年12月17日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对乳腺影像深度学习中预处理步骤缺乏标准化指导的问题,系统评估了不同预处理技术对U-Net模型分割性能的影响。研究人员在CBIS-DDSM和Duke-Breast-Cancer-MRI两个公共数据集上,对比了领域非特异性(DNS)和领域特异性(DS)两种预处理流程,发现像素强度归一化方法(P1-P99和Z-Score)和图像尺寸调整策略对分割准确性有显著影响(3-way ANOVA F-test, α<0.05),为乳腺影像分析提供了重要的预处理优化指导。
在医学影像分析领域,深度学习技术正以前所未有的速度改变着疾病诊断和治疗的格局。特别是在乳腺癌诊断中,精准的图像分割对于病灶定位和定量分析至关重要。然而,一个长期被忽视的问题是:在将图像输入深度学习模型之前,如何进行最优的预处理?这看似简单的步骤,实际上可能成为影响模型性能的关键因素。
目前,医学影像深度学习研究存在一个明显的矛盾:一方面,研究人员深知医学图像与自然图像存在本质差异,医学图像中的每个像素值、空间关系都承载着重要的解剖和生理信息;另一方面,许多研究仍然沿用自然图像处理的预处理方法,这些方法可能会扭曲或丢失对诊断至关重要的信息。特别是在乳腺影像分析中,这种问题更加突出,因为乳腺图像具有模态多样(从2D mammography到3D MRI)、图像特性复杂(定量与非定量图像并存)等特点。
来自葡萄牙里斯本大学和Champalimaud基金会的研究团队意识到了这一问题的严重性,他们在《Scientific Reports》上发表了题为"The impact of pre-processing techniques on deep learning breast image segmentation"的研究论文,系统性地探讨了不同预处理技术对乳腺图像分割性能的影响。
研究人员设计了一项严谨的比较研究,重点评估了两个乳腺影像公共数据集:CBIS-DDSM(乳腺X线摄影)和Duke-Breast-Cancer-MRI(乳腺MRI)。研究团队构建了两种不同的预处理流程:领域非特异性(DNS)流程采用自然图像处理中常见的预处理方法,而领域特异性(DS)流程则专门针对医学影像特点设计,注重保护解剖结构的完整性。
关键技术方法包括使用U-Net分割模型,通过5折交叉验证评估不同预处理组合的效果。研究重点评估了像素强度归一化(Min-Max、P1-P99、Z-Score、Histogram Normalization)、图像尺寸调整(256×256、512×512、1024×1024等)、方向标准化和像素间距标准化等技术。评估指标采用Dice相似系数(DSC)和Hausdorff距离(HD),并通过ANOVA统计检验分析差异显著性。
研究团队设计的两种预处理流程体现了根本性的理念差异。DNS流程代表了当前许多研究中常见的做法,直接迁移自然图像处理的预处理方法,包括简单的图像缩放和强度归一化。而DS流程则充分考虑了医学影像的特殊性,在每一步预处理中都尽可能保持解剖信息的完整性。
从图1的热图中可以清晰看到,不同预处理组合在CBIS-DDSM数据集上产生了显著不同的分割效果。特别是在像素强度归一化方法的选择上,P1-P99和Z-Score方法明显优于传统的Min-Max归一化。这一发现挑战了常规做法,说明简单的最小-最大缩放可能不足以处理医学图像中复杂的强度变化。
研究结果显示,像素强度归一化是影响分割性能的最重要因素之一。在CBIS-DDSM数据集中,使用P1-P99归一化的DS流程模型在256×256输入尺寸下达到了最佳的DSC值0.66。而在Duke-Breast-Cancer-MRI数据集中,Z-Score归一化结合512×512×64输入尺寸的DS流程模型获得了最高的DSC值0.71。
这一发现具有重要的实践意义,因为它表明不同模态的乳腺影像可能需要不同的强度归一化策略。乳腺X线摄影作为非定量图像,其强度值主要反映组织对X射线的吸收程度,而乳腺MRI作为定量图像,其强度值具有明确的物理意义,这种本质差异可能导致了对归一化方法的不同响应。
在图像尺寸处理方面,研究发现了有趣的现象:较小的输入尺寸(256×256)在多数情况下表现更好,这可能与使用的相对较浅的U-Net架构有关。更重要的是,保持图像长宽比的预处理策略(通过填充而非扭曲变形)显著改善了分割性能。
方向标准化在乳腺MRI数据中显示出明显价值,将图像统一到RAS(右前上)方向后,模型对纤维腺体组织和血管等小结构的分割准确性得到提升。然而在乳腺X线摄影中,方向标准化的影响相对较小,这可能是因为乳腺X线摄影本身具有较为一致的成像方向。
图3和图4的视觉对比生动展示了不同预处理策略的实际影响。在图3a中,最佳性能模型(DS流程,256×256输入,P1-P99归一化)能够准确分割乳腺病灶,而图3b中最差性能模型(DNS流程,1024×1792输入,Min-Max归一化)的分割结果明显不理想。这种视觉差异强调了预处理选择对临床实用性的直接影响。
图4进一步展示了在乳腺MRI多组织分割任务中预处理的重要性。图4a中采用Z-Score归一化和方向标准化的模型能够清晰区分乳腺、纤维腺体和血管组织,而图4b中使用直方图归一化的模型在组织边界处出现明显的分割错误。
通过3-way和4-way ANOVA F检验,研究确认了预处理步骤对模型性能影响的统计显著性(α<0.05)。特别是像素强度归一化方法和图像尺寸调整的交互作用达到了高度显著性水平(p-value=1.52E-17),这表明预处理步骤之间存在着复杂的相互依赖关系,不能孤立考虑。
这项研究的最大价值在于为乳腺影像深度学习分析提供了实证性的预处理指导。研究结果表明,盲目套用自然图像的预处理方法可能不利于医学图像分析任务的性能优化。相反,基于医学影像特点设计的领域特异性预处理流程能够更好地保持诊断相关信息,从而提高分割准确性。
研究的局限性主要在于使用的数据集规模相对有限,以及采用的U-Net架构相对较浅。未来研究可以扩展到更大规模的数据集和更先进的网络架构(如nnU-Net或SwinUNet),进一步验证预处理策略的普适性。
这项研究系统评估了预处理技术对深度学习乳腺图像分割的影响,确立了像素强度归一化(特别是P1-P99和Z-Score方法)和图像尺寸调整策略的关键作用。研究结果强调,在医学影像深度学习研究中,预处理不应被视为次要的技术细节,而应作为影响模型性能的关键因素得到充分重视。
随着人工智能在医学影像分析中的日益普及,这项研究为开发更可靠、更准确的乳腺图像分析工具提供了重要基础。未来工作可以扩展到更多模态、更多解剖部位的影像分析,逐步建立医学影像深度学习的标准化预处理规范,最终推动AI辅助诊断在临床实践中的安全有效应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号