边缘感知图推理网络(EGRNet)在图像篡改定位中的创新应用与性能突破

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月04日 来源：Computer Vision and Image Understanding 3.5

编辑推荐：

　　本文推荐：作者提出边缘感知图推理网络(EGRNet)，通过双流编码器（RGB/SRM）提取视觉与噪声特征，结合空间金字塔图推理结构（CGCFFM/EGAM模块），有效抑制篡改与非篡改区域的特征耦合，显著提升定位精度。实验表明该方法在多种篡改类型及攻击下均优于现有技术(SOTA)。

Highlight

• EGRNet采用双流CNN（RGB/SRM编码器）与多尺度空间金字塔图推理结构，实现自上而下的特征融合，兼顾局部细节与全局信息，提升不同尺寸篡改区域的检测能力。

• 设计的跨图卷积特征融合模块(CGCFFM)通过空间与通道图卷积操作，自适应融合视觉与噪声特征，建模像素间长程依赖关系。

• 边缘感知图注意力模块(EGAM)将二值边缘信息融入图注意力邻接矩阵，显式建模篡改与非篡改区域的不一致性，抑制非篡改区域的干扰。

Image Manipulation Localization

随着深度学习技术蓬勃发展，研究者致力于通过CNN或Transformer构建端到端的图像篡改定位方法。例如SPAN利用空间金字塔注意力模块建立多尺度像素级关系，而EGRNet进一步通过图推理技术捕捉全局上下文，显著提升定位鲁棒性。

Proposed Approach

图推理虽能捕获全局上下文，但不同尺度特征应包含一致的长程模式。EGSNet在原始特征空间执行推理，通过分层结构整合浅层细节（高分辨率）与深层语义（全局依赖），其中：

Dataset

实验选用拼接、复制-移动、删除三类篡改数据集（MS COCO synthetic/Defacto），预训练后对四类图像进行微调，验证模型对不同篡改手段的适应性。

Conclusion

EGRNet通过空间金字塔推理机制整合多尺度特征，其核心模块CGCFFM与EGAM分别实现跨模态特征融合与边缘感知解耦，在多项基准测试中展现出卓越的定位精度与抗攻击鲁棒性。

热点排行

联系信箱：

粤ICP备09063491号