编辑推荐:
在生态研究中,红外相机陷阱(ICTs)数据筛选面临复杂背景下动物识别难题。研究人员开展基于目标导向增强的数据筛选方法(GFD-YOLO)研究,结果显示该方法相比 YOLOv11n 模型,mAP 提升 16.96% 等。其对生态监测意义重大。
在生态研究的大舞台上,红外相机陷阱(Infrared Camera Traps,ICTs)就像一个个不知疲倦的 “生态小卫士”,默默地记录着野生动物的一举一动。它们通过高灵敏度的红外运动传感器,能在不惊扰动物的情况下,高效地捕捉动物的图像,为科学家们了解物种多样性、分布情况以及动物的行为模式提供了大量宝贵的数据。
然而,随着数据量的不断增加,问题也接踵而至。从这些海量图像中筛选出有价值的信息,就如同在茫茫大海里捞针一般困难。现有的 ICT 数据筛选方法在面对复杂背景时,就像迷失方向的船只,难以准确识别动物目标,尤其是那些快速移动的 “短跑健将” 和身形小巧的动物。比如,在光线复杂的森林环境中,动物的颜色和纹理可能与周围的植被相似,这就容易导致误判或者漏判;还有在雨雪天气下,环境干扰因素增多,数据筛选更是难上加难。为了解决这些棘手的问题,安徽大学等机构的研究人员踏上了探索之旅,开展了关于目标导向增强的 ICT 数据筛选方法的研究。
研究人员提出了一种名为 GFD-YOLO 的目标导向增强数据筛选方法。该研究成果发表在《Scientific Reports》上,为生态监测领域带来了新的曙光。
研究人员在开展这项研究时,运用了多种关键技术方法。首先是构建数据集,他们从部署在自然保护区的红外相机所拍摄的图像中收集数据,包含 6158 张图像,其中有 3000 组连续三张的图像,并且对图像进行预处理,调整了图像分辨率、平衡动物类别比例等。在模型训练与评估环节,使用 NVIDIA GeForce RTX 4090 GPU,基于 OpenCV、Python、PyTorch 等框架进行深度学习实验,利用平均精度均值(mAP)、精度(Precision)、召回率(Recall)、交并比(IoU)等指标评估模型性能。
下面来看具体的研究结果:
- 不同预处理方法对模型性能的影响:研究人员对比了基于帧差法和光流法的目标导向增强预处理方法对 YOLOv8n、YOLOv11n 和 YOLOv12n 等模型性能的影响。实验发现,这两种预处理方法都能显著提升基线模型在精度、mAP50-95、召回率和 F1 分数等方面的表现。而且,帧差法在各方面都优于光流法,其运行时间仅约为光流法的 9.4% ,性能开销更低。
- GFD-YOLO 方法的优势:以 YOLOv11n 为基线模型,结合高斯滤波的帧差法(GFD-YOLO)表现更为出色。GFD-YOLO 的精度达到 95.41%,mAP50-95为 59.89%,召回率为 84.75%,F1 分数为 0.89,均超过了 YOLOv11n 和未使用高斯滤波的帧差法(FD-YOLOV11)模型。在复杂场景和小目标检测中,GFD-YOLO 展现出更强的适应性,能更准确地检测动物目标,在处理小目标时,其生成的热图中目标区域更集中、更明显。
在研究结论和讨论部分,GFD-YOLO 方法通过基于帧差和高斯滤波实现了数据分布的目标导向转移,有效提升了 ICT 数据筛选的准确性和模型在复杂背景及小目标场景下的检测鲁棒性。与传统方法相比,它无需静态背景重建,降低了性能开销,提高了环境适应性。不过,该方法也存在一些局限性,比如高斯滤波和帧差法的参数设置需要手动调整,数据集主要来自温带森林环境,在快速移动场景下的检测能力还有待提高。
尽管如此,这项研究意义非凡。它为生态监测提供了更精准、高效的工具,能够帮助研究人员更及时地掌握野生动物的动态信息,为生物多样性保护决策提供有力支持。而且,研究人员还提出了未来的研究方向,如进行自适应参数优化、模型轻量化等,有望进一步提升该方法的性能,使其在更广泛的生态监测场景中发挥更大的作用,推动生态保护事业不断向前发展。