
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于迁移学习与特征融合的伪装图像分类方法研究及其在复杂场景中的应用
【字体: 大 中 小 】 时间:2025年07月26日 来源:Knowledge-Based Systems 7.2
编辑推荐:
研究人员针对伪装图像中目标与背景边界模糊、纹理相似导致的分类难题,创新性地提出了一种基于DenseNet201和MobileNet双分支迁移学习(TL)的特征融合架构。通过数据增强扩充COD10K和ERVA 1.0数据集,采用特征级联策略实现98.83%的分类准确率,为军事侦察和生态监测提供新范式。
在自然界和军事领域,伪装技术通过模仿环境纹理和色彩使目标"消失",这种视觉欺骗给计算机视觉系统带来巨大挑战。传统图像处理方法对边缘模糊、低对比度的伪装目标束手无策,而单一深度学习模型也难以捕捉细微的纹理差异。特别是在军事侦察、野生动物监测等场景中,精确识别伪装目标直接关系到任务成败,开发高效分类算法成为亟待突破的技术瓶颈。
论文《An Approach of Transfer Learning and Feature Concatenation for Classification of Camouflage Images》提出创新解决方案。研究人员构建了双分支迁移学习架构,将DenseNet201的密集连接特征与MobileNet的轻量化特征通过水平级联融合,形成多尺度特征表示。采用COD10K(含10类伪装生物)和ERVA 1.0(军事伪装装备)双数据集交叉训练,通过随机旋转等数据增强技术将训练样本扩增6倍至8136幅。实验表明,该模型在两项测试集上分别达到98.41%和98.83%准确率,较单模型提升1.2个百分点。
关键技术包括:1)迁移学习(TL)策略复用ImageNet预训练的9种卷积神经网络(CNN);2)特征级联融合DenseNet201的残差特征与MobileNet的深度可分离卷积特征;3)数据增强解决小样本问题;4)系统评估DenseNet169/EfficientNetV2等5种模型组合性能。
材料与方法
采用COD10K数据集1356幅原始图像,经增强后达8136幅,包含蝴蝶、蛇等10类生物伪装;ERVA 1.0数据集含军事装备伪装。DenseNet201凭借密集连接块(Dense Block)捕获多层次特征,MobileNet通过深度可分离卷积(Depthwise Separable Convolution)提取轻量化特征,二者在全局平均池化层前进行水平拼接。
实验结果
单一模型中DenseNet201表现最优(COD10K 97.67%,ERVA 1.0 98.49%)。特征融合使DenseNet201+MobileNet组合准确率提升至98.83%,显著高于VGG16(95.12%)等传统架构。消融实验证实数据增强使模型泛化能力提升23%。
讨论与结论
该研究首次将异构CNN特征级联应用于伪装分类:1)DenseNet201的密集连接特性有效捕捉纹理渐变;2)MobileNet的轻量化特征补充局部细节;3)交叉数据集训练增强模型鲁棒性。相比基于显著性检测的CamoNet等传统方法,该方案无需人工设计特征,在复杂背景中保持94%的召回率。未来可扩展至动态伪装识别和三维伪装分析领域。
这项发表于《Knowledge-Based Systems》的工作,通过创新性特征融合策略突破了伪装图像分类的技术瓶颈,为自动驾驶障碍物检测、军事目标识别等应用提供了新思路。Erkan Bayram等学者证明,迁移学习与特征工程的有机结合,能够有效解决计算机视觉领域的"视觉欺骗"难题。
生物通微信公众号
知名企业招聘