《Digital Chinese Medicine》:Edge-preserving Image Smoothing Algorithm Combining Edge Guidance And Texture Complexity Perception
编辑推荐:
边缘引导与纹理复杂度感知融合的自适应图像平滑方法,通过边缘检测模块提取关键结构信息,结合纹理强度图实现区域自适应平滑,有效平衡边缘保留与噪声抑制,在医学影像、自动驾驶等场景中显著优于传统方法。
Jianwu Long|Qi Luo|Shuang Chen|Yuanqin Liu
重庆理工大学计算机科学与工程学院,中国重庆,400054
摘要
在数字图像处理中,保持边缘的图像平滑技术是多媒体和计算机视觉任务中的基础技术。该技术旨在去除冗余的纹理和噪声,同时保留图像中的重要边缘特征。然而,现有的平滑方法往往难以在精确的边缘保留和有效的纹理抑制之间取得平衡,尤其是在图像中同时存在复杂纹理和显著结构的情况下。为了解决这个问题,本文提出了一个结合边缘引导和纹理复杂性感知的框架。具体来说,首先设计了一个边缘检测模块,通过利用像素间的差异结合卷积神经网络来提取显著的边缘特征。随后,引入了一个纹理复杂性感知模块,该模块基于方差和均值统计来建模纹理强度图,以指导平滑模块进行自适应处理,从而提高纹理去除的效果。此外,还开发了一个内部结构增强模块,以改善图像中内部结构的恢复。广泛的实验结果表明,所提出的算法在多个公开数据集上优于现有的主流方法,既实现了更好的平滑性能,也保持了结构的完整性。它广泛适用于图像去噪、细节增强、伪影去除和图像风格抽象等任务。
引言
保持边缘的图像平滑技术是图像处理和计算机视觉领域中一种基本且关键的技术。其核心目标是在准确保留和增强显著边缘和重要结构特征的同时,去除图像中的不重要细节和噪声。这项技术在各个领域都展示了广泛而深远的应用价值。例如,在医学成像中,保持边缘的平滑技术可以有效地突出器官轮廓和病变边界,为临床诊断提供更准确的视觉线索。在自动驾驶中,它帮助车辆准确识别道路边界、交通标志和障碍物,从而提高自动驾驶系统的安全性和可靠性。在基于图像的艺术创作中,它有助于消除分散注意力的细节,同时保留图像的主要结构成分,生成具有更强视觉和美学吸引力的艺术品。
在过去几十年中,保持边缘的图像平滑技术已经从传统方法发展到基于深度学习的方法。传统方法主要分为加权平均算法和基于全局优化的算法,这些方法依赖于手工制作的滤波器和数学模型。例如,双边滤波器[2]通过结合空间距离和颜色相似性来进行平滑处理,但可能会在复杂边缘周围产生光晕或梯度反转等伪影。基于优化的方法,如L0梯度最小化[3],可以获得良好的平滑效果,但通常计算成本较高,使得大规模图像的实时处理变得困难。近年来,随着深度学习的快速发展,基于卷积神经网络(CNN)的方法成为了研究焦点。这些方法可以从大规模图像数据集中自动学习语义和结构特征,实现更高效和精确的边缘保持平滑。
总之,保持边缘的图像平滑技术在图像处理和计算机视觉领域仍然是一个具有重大研究意义和实际应用价值的话题。尽管已经取得了一定的进展,但仍有一些关键挑战尚未解决,包括如何进一步提高平滑质量、降低计算成本以及减少对标记训练数据的依赖。
为了解决这些问题,本研究提出了一种基于深度学习的新型保持边缘的图像平滑方法。目标是通过创新的网络架构和优化策略,实现更高效、准确和泛化的平滑性能,从而为相关领域的实际应用提供强大的技术支持。
- •
我们提出了一种结合边缘引导和纹理复杂性感知的图像平滑算法。具体来说,我们整合了一个边缘检测模块来提取显著的边缘特征,并将其融合到平滑过程中,以防止在纹理抑制过程中丢失关键的结构信息。
- •
我们设计了一个纹理复杂性感知模块,该模块结合了传统的统计测量方法和深度特征来生成空间对齐的纹理强度图。这个图指导平滑模块进行自适应平滑处理,从而提高整体平滑度和细节恢复效果。
- •
我们进行了广泛的定量和定性实验,证明我们的方法在多个公开数据集上表现出优于现有最先进方法的平滑性能,在纹理去除和边缘保留方面都有显著提升。
本文的其余部分组织如下:第2节将简要介绍相关工作;第3节介绍了本文提出方法的背景和相应的方法介绍;第4节展示了本文的实验结果和分析;第5节介绍了我们算法的各种应用;最后,第6节总结了论文内容。
小节片段
基于加权平均的方法
基于加权平均的方法,也称为局部滤波方法,在图像平滑中得到广泛应用,特别是在平滑过程中保留边缘细节方面。这些方法使用加权平均策略在图像的局部区域内进行滤波,从而避免过度平滑导致边缘模糊。最具代表性的局部滤波方法之一是双边滤波(BLF)[2],它结合了空间邻近性和像素强度
动机
当前的图像平滑方法在处理复杂场景时面临几个限制。首先,对纹理和结构之间耦合的建模不足。大多数现有方法在预处理过程中未能明确考虑纹理的多样性和空间异质性。例如,在自然图像中,高频噪声经常与真实边缘混合在一起。因此,平滑模块难以区分纹理细节和关键结构
数据集和实验设置
主要训练数据集是SPS数据集[21],它在计算机视觉研究中得到广泛应用。SPS包含200张真实世界的图像,涵盖人类、动物、植物、建筑物以及室内和室外环境等不同对象和场景。此外,它还包括100种纹理模式,用于生成20,000张合成纹理图像。SPS数据集的示例如图5所示。为了评估图像平滑的性能,我们采用了两种广泛使用的
应用
图像平滑技术也可以作为各种计算机视觉任务中的预处理技术,例如图像去噪[40]、细节增强[41]、卡通图像的压缩伪影去除[5]、边缘检测[8]和图像抽象[7]。为了进一步证明我们提出算法的有效性和优越性,我们将其应用于几个代表性的图像处理任务中。结论
本文系统地研究并提出了一种结合边缘引导和纹理复杂性感知的图像平滑算法。我们详细阐述了构建的网络的整体架构,介绍了每个模块的设计理念和运作机制。为了解决高频纹理和结构信息混合的问题,TCPM通过局部均值和方差对纹理强度进行建模,实现了区域自适应的平滑引导策略
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。