
-
生物通官微
陪你抓住生命科技
跳动的脉搏
边缘感知图推理网络(EGRNet)在图像篡改定位中的创新应用与性能突破
【字体: 大 中 小 】 时间:2025年09月04日 来源:Computer Vision and Image Understanding 3.5
编辑推荐:
本文推荐:作者提出边缘感知图推理网络(EGRNet),通过双流编码器(RGB/SRM)提取视觉与噪声特征,结合空间金字塔图推理结构(CGCFFM/EGAM模块),有效抑制篡改与非篡改区域的特征耦合,显著提升定位精度。实验表明该方法在多种篡改类型及攻击下均优于现有技术(SOTA)。
Highlight
• EGRNet采用双流CNN(RGB/SRM编码器)与多尺度空间金字塔图推理结构,实现自上而下的特征融合,兼顾局部细节与全局信息,提升不同尺寸篡改区域的检测能力。
• 设计的跨图卷积特征融合模块(CGCFFM)通过空间与通道图卷积操作,自适应融合视觉与噪声特征,建模像素间长程依赖关系。
• 边缘感知图注意力模块(EGAM)将二值边缘信息融入图注意力邻接矩阵,显式建模篡改与非篡改区域的不一致性,抑制非篡改区域的干扰。
Image Manipulation Localization
随着深度学习技术蓬勃发展,研究者致力于通过CNN或Transformer构建端到端的图像篡改定位方法。例如SPAN利用空间金字塔注意力模块建立多尺度像素级关系,而EGRNet进一步通过图推理技术捕捉全局上下文,显著提升定位鲁棒性。
Proposed Approach
图推理虽能捕获全局上下文,但不同尺度特征应包含一致的长程模式。EGSNet在原始特征空间执行推理,通过分层结构整合浅层细节(高分辨率)与深层语义(全局依赖),其中:
CGCFFM:通过交叉空间图卷积与通道图卷积,将特征映射至低维空间以建模长程关系。
EGAM:基于边缘信息重构邻接矩阵,控制篡改区内外信息传递,增强特征解耦能力。
Dataset
实验选用拼接、复制-移动、删除三类篡改数据集(MS COCO synthetic/Defacto),预训练后对四类图像进行微调,验证模型对不同篡改手段的适应性。
Conclusion
EGRNet通过空间金字塔推理机制整合多尺度特征,其核心模块CGCFFM与EGAM分别实现跨模态特征融合与边缘感知解耦,在多项基准测试中展现出卓越的定位精度与抗攻击鲁棒性。
生物通微信公众号
知名企业招聘