
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度空间-通道交互注意力与可解释引导网络(MSCIAIG-Net)在遥感图像细粒度舰船分类中的创新应用
【字体: 大 中 小 】 时间:2025年06月22日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
【编辑推荐】针对遥感图像(RSI)中细粒度舰船分类(FGSC)存在的背景噪声干扰和模型鲁棒性下降问题,研究人员提出融合多尺度空间-通道交互注意力模块(MSCIAM)和可解释引导的组合优化损失LCOFC的MSCIAIG-Net,通过可解释性分析网络剪枝(IANP)策略实现模型压缩与性能提升,在FGSC-23数据集上总体准确率(OA)提升6.79%。该研究为军事/民用舰船监控提供了可信赖的AI决策范式。
在复杂遥感环境下,细粒度舰船分类(RSI-FGSC)面临两大核心挑战:一是受光照、角度和背景干扰导致特征提取困难,二是高相似度舰船类别间存在"大类间差异小、小类内差异大"的特性。传统方法依赖复杂网络结构或注意力机制,往往陷入参数冗余和背景噪声干扰的困境,甚至出现将辅助船(AU)误判为油轮(OT)的典型案例。更严峻的是,现有研究鲜少关注模型决策的可解释性,而这对涉及国家安全的军事应用至关重要。
针对这些痛点,中国某高校团队在《Engineering Applications of Artificial Intelligence》发表的研究中,创新性地提出MSCIAIG-Net网络架构。该研究首次通过可视化归因技术揭示了模型鲁棒性下降与参数冗余的因果关系,并建立包含三个核心组件的解决方案:多尺度空间-通道交互注意力模块(MSCIAM)实现跨尺度特征融合,可解释性指导的组合优化损失LCOFC增强显著区域特征学习,以及基于可解释性分析的网络剪枝(IANP)策略实现模型轻量化。研究采用FGSC-23和自建FGSCR-8数据集验证,其中FGSCR-8通过FAIR1M数据集重组获得,包含更丰富的军民舰船亚类。
【多尺度空间-通道交互注意力模块】
MSCIAM通过并行空间/通道注意力路径建模特征重要性,其中空间分支采用空洞卷积捕获多尺度上下文,通道分支通过SE(Squeeze-and-Excitation)机制强化判别性特征。实验表明该模块能使ResNet50骨干网络在FGSC-23上平均准确率(AA)提升5.54%。
【可解释性引导的优化损失】
创新设计的LCOFC损失包含三部分:改进的Triplet Loss增强类间分离度,注意力约束损失抑制背景干扰,以及基于Grad-CAM的可解释性监督。可视化显示该损失能使模型聚焦舰船首尾等关键区域,避免传统方法中因过度关注背景导致的误判。
【可解释性网络剪枝策略】
IANP通过两层剪枝准则实现:初级剪枝基于卷积核激活强度,二级剪枝结合可解释性评分。在ResNet50上剪除约18%参数后,模型非但未出现性能衰减,OA反提升1.2%,证实冗余参数确实携带干扰信息。
该研究的突破性在于将可解释性分析从后验诊断工具发展为模型优化驱动力。军事应用价值尤为突出——通过可视化归因技术,决策者能直观理解模型将"驱逐舰"判定为"巡洋舰"的依据是否基于炮塔位置等真实军事特征。研究者特别指出,MSCIAM对舰船首尾空间关系的建模能力,解决了传统局部注意力机制难以捕捉舰体全局结构的问题。未来工作将探索该范式在遥感图像目标检测等任务的迁移应用,为构建可信赖的军事AI系统提供新思路。
生物通微信公众号
知名企业招聘