基于上下文引导的Transformer改进版YOLOv8模型,用于精准检测和计数幼年鲍鱼
《Smart Energy》:Context guided transformer enhanced YOLOv8 for accurate juvenile abalone detection and counting
【字体:
大
中
小
】
时间:2025年08月07日
来源:Smart Energy 5
编辑推荐:
精准检测与计数对估算幼鲍鱼种群生物量和养殖密度至关重要,但传统算法因目标过小、密集重叠及遮挡问题难以实现高精度。本研究提出CGT-YOLO模型,基于YOLOv8架构引入上下文引导模块(CG模块)增强全局上下文感知,上下文Transformer模块(CoT模块)优化局部注意力机制,新增小目标检测层提升细粒度特征提取,并改进为Inner-CIoU损失函数加速收敛并提升边界框回归精度。实验表明,CGT-YOLO在密集遮挡场景下检测精度达98.44%,APs为39.71%,显著优于YOLOv8及Faster R-CNN等基线模型,有效解决养殖环境中幼鲍鱼识别难题。
在现代水产养殖领域,准确地检测和统计幼鲍的数量对于估算种群生物量和养殖密度具有重要意义。然而,由于幼鲍体型较小、分布密集以及在养殖过程中经常出现个体相互遮挡的情况,现有的检测算法在识别幼鲍时往往表现出较低的精度。为了解决这一问题,本文提出了一种名为CGT-YOLO的模型,它基于YOLOv8进行改进,旨在提升幼鲍的检测与统计效果。YOLOv8作为一种高效的单阶段检测算法,以其快速的推理速度和较高的检测精度而受到广泛关注。通过引入Context Guided(CG)模块和Contextual Transformer(CoT)模块,CGT-YOLO在保持YOLOv8原有优势的同时,显著增强了其对小目标和密集重叠目标的识别能力,从而有效应对幼鲍检测中的关键挑战。
本文提出的CGT-YOLO模型主要通过以下几个方面进行优化。首先,CG模块被用于下采样输入图像,扩大模型的接收视野并保留更多与目标相关的信息,从而减少检测过程中的信息损失。其次,CoT模块被整合到模型结构中,以增强模型对小尺寸和密集重叠目标的关注能力,减少漏检和误检的情况。此外,还构建了一个专门用于小目标检测的检测层,该层依赖于较低层级的高分辨率特征表示,以保留更多的低级细节信息,如形状和纹理,从而提高小目标的检测精度。最后,采用优化后的Inner-CIoU损失函数,通过引入比例因子来调整模型的边界框维度,从而加快模型训练的收敛速度并进一步提升检测精度。
在实验部分,研究人员使用自建的鲍鱼数据集进行测试,验证了CGT-YOLO模型在幼鲍检测任务中的优越性。实验结果表明,CGT-YOLO在多个评估指标上均优于其他现有模型,特别是在处理个体相互粘附和重叠的情况时,其检测精度和稳定性得到了显著提升。这表明CGT-YOLO在实际水产养殖应用中具有较高的可靠性和有效性。
为了进一步验证模型的性能,研究团队还进行了模块化实验,分析了CG模块、CoT模块、小目标检测层以及Inner-CIoU损失函数各自对模型性能的贡献。实验结果表明,这些模块在提升模型的检测精度和稳定性方面具有重要作用,且它们之间存在良好的协同效应。CG模块在扩大模型的接收视野和增强语义特征表示方面发挥了关键作用,CoT模块则通过引入上下文注意力机制,提升了模型在密集遮挡场景下的目标区分能力。小目标检测层通过利用低层级的高分辨率特征表示,增强了模型对细节特征的感知能力。Inner-CIoU损失函数通过动态调整边界框的回归区域,提高了边界框定位的准确性和稳定性。
此外,研究团队还对Inner-CIoU损失函数的有效性进行了验证。通过在不同比例因子下调整补充边界框的大小,并与现有损失函数如GIoU、EIoU和SIoU进行对比,发现Inner-CIoU在特定比例因子(如1.10)下显著提升了模型的检测精度和mAP值。这表明Inner-CIoU损失函数在处理密集遮挡场景中的边界框回归问题上具有优势,能够更精确地控制预测边界框的位置和形状。
在对CoT注意力机制的有效性进行验证时,研究团队利用LayerCAM技术生成热图,并对比了引入CoT机制前后的模型表现。实验结果表明,当CoT机制被引入时,模型在密集遮挡场景中的注意力更加集中和精确,能够更有效地识别幼鲍。即使在个体相互遮挡的情况下,模型依然能够准确检测并识别被遮挡的幼鲍,生成的热图也清晰地突出了其位置。这表明CoT机制在提升模型对小目标的识别能力方面具有重要作用。
综合来看,CGT-YOLO模型在幼鲍检测和统计任务中展现出显著的优势。它不仅在静态图像数据上表现优异,而且具备在复杂环境下的稳定性和适应性。然而,当前实验主要基于静态图像数据,尚未在动态视频场景和边缘设备上进行全面测试。因此,未来的研究可以进一步探索模型在实际环境中的性能表现,包括优化模型的轻量化策略,如模型剪枝、量化和知识蒸馏,以提升其在边缘设备上的运行效率。同时,研究团队还计划在真实水产养殖环境中使用视频流数据进行动态检测实验,以系统评估模型在复杂环境中的稳定性和泛化能力,并进一步扩展模型在其他贝类养殖物种中的适用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号