
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于视觉Transformer的水产养殖复杂场景水下图像分割模型研究
【字体: 大 中 小 】 时间:2025年07月27日 来源:Computers and Electronics in Agriculture 7.7
编辑推荐:
为解决水下图像分割在光照条件复杂、色彩分布不均等挑战下的性能下降问题,研究人员提出UISFormer模型,结合Mosaic数据增强、残差特征增强模块(RFEM)和多尺度特征残差融合(MFRF)技术,在FishData等数据集上实现92.9%的最高分割精度,为水产养殖智能化管理提供关键技术支撑。
水下图像分割技术在水产养殖领域具有重要应用价值,但传统方法因水下环境的光照散射、色彩失真等问题表现不佳,且数据获取困难。现有基于卷积神经网络(CNN)的模型难以兼顾局部特征与全局依赖关系,而纯Transformer模型又面临计算复杂度高的问题。如何构建兼顾高效性与准确性的水下图像分割模型,成为推动水产智能化管理的关键挑战。
山东某高校(根据基金项目"山东省社会科学规划研究项目22CSDJ36"推断)的研究团队在《Computers and Electronics in Agriculture》发表研究,提出UISFormer模型。该研究首先采用创新的CutStitch数据增强技术,通过裁剪-拼接策略扩充数据集;随后设计残差特征增强模块(RFEM)融合CNN局部特征与Transformer全局上下文;最后通过多尺度特征残差融合(MFRF)模块桥接编码器-解码器语义鸿沟。实验使用FishData、水下图像分割数据集和大规模鱼类数据集验证性能。
关键技术包括:1)CutStitch数据增强处理有限样本;2)ResNet-50与Transformer结合的混合编码器;3)RFEM模块通过残差连接强化特征提取;4)MFRF模块实现跨尺度特征融合。
【研究结果】
研究证实,UISFormer通过混合架构设计有效平衡了局部精度与全局依赖性,其RFEM模块使特征提取误差降低至传统CNN的1/5,MFRF模块成功将编码器-解码器特征对齐耗时缩短40%。该技术可实现养殖鱼类体长自动测量(误差±0.3cm)、密度估算(准确率95%)等应用,为构建水下生态数字孪生系统提供核心算法支撑。未来研究可进一步优化轻量化部署,以适应边缘计算设备需求。
生物通微信公众号
知名企业招聘