编辑推荐:
研究人员为解决内陆水域漂浮物检测难题,构建 IWHR_AI_Lable_Floater_V1 数据集评估主流算法,推动 AI 在水行业应用。
# 内陆水域漂浮物检测研究:数据集构建与算法评估
在广袤的地球家园中,河流、湖泊等内陆水域宛如大地的脉络,滋养着万物。但近年来,这些水域却遭遇了 “垃圾入侵” 的困扰。海洋垃圾问题日益严峻,而内陆水域的漂浮垃圾,如人类丢弃的生活垃圾、动植物残体、工业废弃物等,不仅严重破坏了水生态环境,影响水质,危及水生生物的生存,还可能顺着水流进入海洋,成为海洋垃圾的重要源头。传统的人工清理方式不仅效率低下、成本高昂,还让清理工人面临安全风险。随着人们对水环境关注度的提升,开发高效的漂浮物清理技术迫在眉睫。在这样的背景下,精准的漂浮物检测系统成为关键,而计算机视觉技术的发展为解决这一难题带来了希望。
为攻克内陆水域漂浮物检测的难关,中国水利水电科学研究院、流域水循环模拟与调控国家重点实验室的研究人员 Guangchao Qiao、Mingxiang Yang、Hao Wang 等开展了深入研究。他们的研究成果发表在《Scientific Data》上,为该领域的发展提供了重要支撑。
研究用到的主要技术方法
研究人员主要采用了数据采集与标注、模型训练与评估等技术方法。数据采集借助岸基设备,如视频监控摄像头和手机,在真实河湖现场收集含漂浮物的视频。从不同角度、光照条件和背景下采集数据,保证样本多样性。之后,利用 LabelImg 软件对图像中漂浮物进行标注。在模型训练与评估方面,选取 9 种常用深度学习目标检测算法,包括 Faster R-CNN、YOLOv9 等,将数据集按 8:1:1 划分为训练集、验证集和测试集,在配备 NVIDIA RTX 3090 GPU 的服务器上训练模型,每个模型训练 300 轮,并记录训练损失和验证平均精度均值 (mAP) ,最终在测试集上评估模型性能。
研究结果
- 数据集介绍:研究人员构建了 IWHR_AI_Lable_Floater_V1 数据集,该数据集包含 3000 张带有精确标注信息的图像,这些图像由岸基拍摄设备采集,涵盖多种场景和特征的漂浮物,包括常见的家庭垃圾如塑料瓶、泡沫板,以及水生植物、藻类等堆积的漂浮物。数据集中 672 张图像由视频监控摄像头捕获,其余由手机拍摄,共标注了 23692 个漂浮物对象。经统计,94.5% 的对象像素占比小于 10%,这表明数据集中小目标漂浮物占比较大12。
- 算法性能评估:研究人员基于 IWHR_AI_Lable_Floater_V1 数据集对 9 种常用深度学习目标检测算法进行评估。训练过程中,各模型训练完成后均收敛至较低损失水平。在测试集上的评估结果显示,不同检测器的 mAP 约为 65.0% 。其中,YOLOv9 的 mAP 最高,达到 67.7%,但整体检测精度仍有待提高,这也表明水面小目标检测任务具有挑战性34。
研究结论与意义
研究人员构建的 IWHR_AI_Lable_Floater_V1 数据集,是基于视频监控摄像头和移动设备视角的真实内陆水域漂浮物数据集,为相关研究提供了宝贵资源。该数据集包含大量小尺寸、特征和场景多样的漂浮物图像,有助于推动水域小目标检测研究。同时,对主流检测算法的评估,为后续优化算法、提高漂浮物检测精度提供了参考依据,对促进 AI 技术在水行业的应用,实现高效清理内陆水域漂浮物、保护水生态环境具有重要意义。这一研究成果为解决内陆水域漂浮物污染问题奠定了坚实基础,有望在未来的水环境治理中发挥重要作用,助力打造更加清洁、健康的内陆水域生态系统。