
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于傅里叶变换交叉注意力层的遥感图像超分辨率重建模型FocalSR研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Geomatica
编辑推荐:
为解决遥感图像多目标场景下细节恢复不足的问题,研究人员提出融合傅里叶变换交叉注意力层(FFC)的Transformer模型FocalSR。该研究通过整合Hybrid Attention Transformer(HAT)的通道注意力与SwinFIR的频域卷积,在NAIP和MAID数据集上实现PSNR提升1 dB,显著改善植被纹理和规则结构重建效果,为遥感图像处理提供新范式。
遥感图像在环境监测、城市规划等领域应用广泛,但其分辨率受限问题长期困扰学术界。传统超分辨率(SR)方法如EDSR、RCAN基于卷积神经网络(CNN),在单目标场景表现良好,但面对遥感图像中多尺度、多对象的复杂场景时,因注意力机制覆盖不足导致细节丢失。尤其当图像包含森林、城市等混合地物时,现有Transformer模型如HAT虽引入窗口自注意力(W-MSA),仍难以兼顾全局光谱特征与局部纹理。
为解决这一挑战,来自中国的研究团队提出FocalSR模型,创新性地将Fast Fourier Convolution(FFC)嵌入交叉注意力层。该模型在DF2K数据集(含3350对图像)预训练后,于NAIP、MAID等遥感数据集验证性能。关键技术包括:1)混合注意力块(HAB)整合通道注意力(CAB)与移位窗口自注意力(SW-MSA);2)重叠交叉注意力FFC块(OCFB)融合空间卷积与频域处理;3)采用L1损失函数和Adam优化器(β1=0.9,β2=0.99)进行800,000次迭代训练。
3.1 与现有模型的性能对比
在Set14和Urban100通用数据集上,FocalSR的PSNR达30.01/28.63,LPIPS低至0.1987/0.2210,显示其对复杂结构的重建优势。在遥感专用数据集NAIP中,其PSNR(28.80)较HAT提升1.59 dB,且植被冠层(图5)和屋顶波纹(图3)的纹理恢复效果显著。
3.2 傅里叶卷积的机制解析
通过局部归因图(LAM)分析发现(图6),FFC模块使注意力层激活像素增加37%,有效捕捉图像全局频率特征。频域处理弥补了传统窗口注意力对长程依赖建模的不足,特别适用于跨尺度地物并存的遥感场景。
3.3 应用潜力展望
该模型在1米分辨率NAIP数据中成功还原农田垄沟(图5),验证其在精准农业中的价值。未来通过适配多光谱输入,可进一步支持灾害评估等跨尺度分析任务。
研究结论表明,FocalSR通过频域-空间域协同注意力机制,突破传统SR模型对遥感图像多对象场景的适应性瓶颈。其创新性架构为高分辨率地表观测数据生成提供新工具,相关成果发表于《Geomatica》,代码已开源以促进领域发展。
生物通微信公众号
知名企业招聘