编辑推荐:
在水下养殖环境中,光照、水质等致图像风格变异带来领域偏移挑战。研究人员开展海参检测模型 UICTDG-YOLO 研究,融合频域增强、SENetv2 等,实验显示 mAP 等指标提升,为科学养殖提供技术支持。
在水产养殖水下环境中,光照条件、水质、浮游生物存在等因素引起的图像风格变化,给目标检测任务带来显著的领域偏移挑战。为应对这些挑战,本文提出一种新的海参检测模型 UICTDG-YOLO,其利用颜色领域泛化技术。具体而言,采用基于傅里叶变换(Fourier transform)的频域增强方法,该技术通过在保留原始相位谱的同时扰动振幅谱来重建图像,有效增强不同水生环境中的颜色一致性。此外,集成参数化补偿机制以保留目标信息,从而扩充数据集、增加领域多样性并提高模型的泛化能力。海参检测的主要挑战之一是从复杂背景元素中区分目标特征,为此,在模型主干中集成基于 SENetv2 的压缩和聚合网络,增强从杂乱水下环境中提取关键目标特征的能力。另外,考虑到不同养殖环境中海参的形状和尺度变化显著,以及存在与海参纹理相似的背景物体,在网络颈部融入双向特征金字塔网络(BiFPN)模块,促进多尺度特征融合,提高不同尺度下的检测精度并有效减少背景干扰。鉴于数据集中的类别不平衡问题,采用 Focal-GIoU 损失函数来解决正负样本不平衡问题,同时提高边界框回归精度。实验结果表明,UICTDG-YOLO 显著优于基线模型,平均精度均值(mAP)提高 5.8%,精度(P)提高 5.8%,召回率(R)提高 6.2%。该模型包含 1040 万个参数,计算量为 27.5 GFLOPs,检测速率为 28.5 帧 / 秒。与 Faster R-CNN、YOLO 系列模型、WQTDG-YOLO 和 OA-DG 等著名目标检测模型相比,UICTDG-YOLO 在真实养殖环境中的海参检测任务中表现出明显优势。该模型为海参的科学养殖提供了有价值的技术见解和实际应用。