
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自监督Kolmogorov-Arnold网络的少样本遥感图像语义分割方法研究
【字体: 大 中 小 】 时间:2025年07月20日 来源:Neural Networks 6.0
编辑推荐:
针对极端标注稀缺(≤5%标注样本)场景下自监督学习性能骤降问题,华中师范大学张吉勇团队提出SS-KAN框架,创新性地将KAN网络的可学习激活函数与深度可分离卷积结合,通过深度KAN模块和双分支适配策略,在仅1%标注数据下实现遥感图像分割SOTA性能,为少样本地物识别开辟新途径。
遥感图像分割技术正面临"数据饥渴"的困境。当前高分辨率卫星每天产生数以TB计的影像数据,但专业地物标注需要测绘专家耗时数月完成,导致标注成本居高不下。传统自监督学习(SSL)方法如MoCo在常规场景表现优异,但当标注比例低于5%时性能断崖式下跌——这源于两个本质缺陷:未充分挖掘无标签数据的层级表征,以及预训练特征迁移时的信息不可逆损失。
华中师范大学计算机学院张吉勇团队在《Neural Networks》发表的研究中,首次将新兴的Kolmogorov-Arnold网络(KAN)引入遥感领域。KAN区别于传统神经网络的革命性设计在于:在网络边缘植入可动态调整的激活函数,这种自适应非线性特性使其在复杂高维数据处理中展现出惊人潜力。研究团队通过深度KAN模块和双分支适配策略两大创新,构建了SS-KAN框架。
关键技术包括:(1)采用WHDLD等3个基准数据集,包含4940张256×256像素多光谱图像;(2)预训练阶段设计多尺度膨胀卷积( dilation rate=2/4/8)与可学习ReLU组合的深度KAN模块;(3)微调阶段通过标准卷积(保持空间语义)与KAN残差映射(抑制特征退化)的双分支协同优化。
【深度KAN模块设计】
通过深度可分离卷积(depthwise separable convolution)与不同膨胀率的组合,在4个尺度分支上提取多方向特征。关键创新是在每个分支末端植入可学习B样条激活函数,实验显示该设计使无监督特征提取效率提升23.7%。
【双分支适配策略】
在下游任务微调时,主分支采用3×3标准卷积维持空间上下文,辅助分支将KAN模块嵌入残差连接的恒等映射(identity mapping)中。消融实验证实该策略使特征迁移损失降低41.2%。
【少样本性能验证】
在仅1%标注数据设定下,SS-KAN在WHULC数据集上达到78.4% mIoU,较SeCo提升12.3个百分点。特别在道路、水体等线性地物分割任务中,边缘连续性指标提升达19.8%。
该研究开创性地证明:KAN网络的自适应非线性特性与卷积神经网络的结合,能有效突破少样本学习的表征瓶颈。提出的深度KAN模块通过可学习激活函数实现特征空间的动态形变,而双分支结构则巧妙平衡了特征迁移中的语义保持与非线性增强。这项成果不仅为遥感智能解译提供了新工具,其核心思想对医学影像分割等少样本场景同样具有启示意义。未来研究可探索KAN模块在Transformer架构中的迁移潜力,以及面向多时相遥感数据的时序自适应机制。
生物通微信公众号
知名企业招聘