边缘感知图推理网络(EGRNet)在图像篡改定位中的创新应用与性能突破

【字体: 时间:2025年09月04日 来源:Computer Vision and Image Understanding 3.5

编辑推荐:

  本文推荐:作者提出边缘感知图推理网络(EGRNet),通过双流编码器(RGB/SRM)提取视觉与噪声特征,结合空间金字塔图推理结构(CGCFFM/EGAM模块),有效抑制篡改与非篡改区域的特征耦合,显著提升定位精度。实验表明该方法在多种篡改类型及攻击下均优于现有技术(SOTA)。

  

Highlight

• EGRNet采用双流CNN(RGB/SRM编码器)与多尺度空间金字塔图推理结构,实现自上而下的特征融合,兼顾局部细节与全局信息,提升不同尺寸篡改区域的检测能力。

• 设计的跨图卷积特征融合模块(CGCFFM)通过空间与通道图卷积操作,自适应融合视觉与噪声特征,建模像素间长程依赖关系。

• 边缘感知图注意力模块(EGAM)将二值边缘信息融入图注意力邻接矩阵,显式建模篡改与非篡改区域的不一致性,抑制非篡改区域的干扰。

Image Manipulation Localization

随着深度学习技术蓬勃发展,研究者致力于通过CNN或Transformer构建端到端的图像篡改定位方法。例如SPAN利用空间金字塔注意力模块建立多尺度像素级关系,而EGRNet进一步通过图推理技术捕捉全局上下文,显著提升定位鲁棒性。

Proposed Approach

图推理虽能捕获全局上下文,但不同尺度特征应包含一致的长程模式。EGSNet在原始特征空间执行推理,通过分层结构整合浅层细节(高分辨率)与深层语义(全局依赖),其中:

  • CGCFFM:通过交叉空间图卷积与通道图卷积,将特征映射至低维空间以建模长程关系。

  • EGAM:基于边缘信息重构邻接矩阵,控制篡改区内外信息传递,增强特征解耦能力。

Dataset

实验选用拼接、复制-移动、删除三类篡改数据集(MS COCO synthetic/Defacto),预训练后对四类图像进行微调,验证模型对不同篡改手段的适应性。

Conclusion

EGRNet通过空间金字塔推理机制整合多尺度特征,其核心模块CGCFFM与EGAM分别实现跨模态特征融合与边缘感知解耦,在多项基准测试中展现出卓越的定位精度与抗攻击鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号