MSFENet：基于多尺度滤波增强网络的数字图像篡改痕迹定位新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computer Vision and Image Understanding》：MSFENet: Multi-Scale Filter-Enhanced Network architecture for digital image forgery trace localization

【字体：大中小】 时间：2025年10月26日 来源：Computer Vision and Image Understanding 3.5

编辑推荐：

　　本文提出了一种创新的多尺度滤波增强网络（MSFENet），通过整合NoisePrint++、SRM和Bayar Conv三种滤波器的互补优势，结合坐标注意力特征校正（CAFR）和多尺度选择性融合（MSF）模块，有效解决了传统篡改定位方法对标注数据依赖性强、计算成本高及痕迹捕捉能力不足的痛点。实验表明该模型在多个基准数据集上实现了最先进的性能（如DSO-1数据集F1值提升48.8%），为数字媒体取证提供了更高效的解决方案。

章节亮点

相关工作

图像篡改定位领域近十年经历了从传统方法到深度学习方法的显著演进。早期研究（Zeng等，2017；Yao等，2017；Chen等，2017；Liu等，2013；Zhao等，2012；Hao等，2024）主要依赖手工特征（如压缩伪影、成像设备签名和感知哈希）。这些方法虽在特定篡改类型中表现良好，但面对日益复杂的伪造技术时泛化能力有限。

模型概述

我们提出的MSFENet是一种新型图像篡改定位模型，它巧妙融合NoisePrint++、Bayar Conv和SRM滤波器的互补优势，分别捕获噪声信息、信号残差和未知语义的深层纹理特征，实现篡改区域的精准定位。模型工作流程分为三个阶段：特征提取阶段、校准融合阶段和决策阶段（整体架构如图1所示）。

实验设置

训练数据集：我们采用与EITLNet（Guo等，2024）相同的训练集，包含公共合成图像数据集（Bappy等，2017）和Casiav2（Dong等，2013）的数据。合成篡改图像通过拼接原始图像与MS-COCO（Lin等，2014）中的目标区域生成，其中Casiav2包含7492张真实图像和5123张伪造图像。

测试数据集：为全面评估模型性能，我们选用六个常用基准数据集：COVER（Wen等，2016）、Casiav1（Dong等，2013）、Columbia（Hsu和Chang，2006）、DSO-1（De Carvalho等，2013）、NIST16（Guan等，2019）和IMD20（Novozamsky等，2020）。

结论

MSFENet通过学习三种滤波器特征与RGB图像特征的互补性，在多种篡改类型检测中展现出卓越性能。我们设计的跨模态特征校准与融合模块，能够高效学习多尺度噪声信息与RGB特征的互补关系，逐步提升篡改区域定位的精准度。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号