基于深度学习与无人机影像的农业景观中常见田鼠洞穴自动检测与量化研究

【字体: 时间:2025年10月13日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本研究针对农业鼠害监测中田鼠洞穴识别效率低、主观性强的问题,采用深度学习(DL)与随机森林(RF)、支持向量机(SVM)等传统分类方法,对比分析了15米与25米飞行高度下高分辨率无人机影像的检测性能。结果表明,基于卷积神经网络(CNN)的DL方法在精确度(0.92)、召回率(0.81)和F1分数(0.83)上均显著优于传统方法,尤其大幅降低了误判率,为农业害虫早期预警提供了可靠技术方案。

  
在广袤的农田中,一种看似不起眼的小动物——常见田鼠(Microtus arvalis),正悄然成为农业生产的"隐形杀手"。这种半地下生活的啮齿类动物每隔2-5年就会出现种群爆发,密度可超过每公顷2000只,是其他田鼠物种的十倍以上。它们不仅大肆啃食谷物、饲料作物、豆类、油菜、向日葵、甜菜和马铃薯等作物,造成严重经济损失,还在高密度时期可能成为兔热病等人畜共患病的传播媒介,对环境和人类健康构成显著威胁。
以西班牙卡斯蒂利亚-莱昂地区为例,2007年的田鼠大爆发导致300-400万公顷农田受灾,造成了过去十年中谷物、马铃薯和葡萄园的最高损失记录,减灾成本高达1500万欧元。目前,对田鼠种群的监测主要依靠直接(如诱捕)和间接(如识别活动痕迹)方法,其中活跃洞穴的数量被认为是评估田鼠分布和数量的最可靠指标之一。然而,传统的野外调查方法需要大量人力和物力资源,且存在观察者主观性强的问题。因此,开发一种高效、低资源消耗、客观的自动识别和量化田鼠洞穴入口的方法迫在眉睫。
随着遥感技术的发展,特别是无人机(UAS)技术的成熟,为鼠害监测带来了新的机遇。无人机能够获取低空高分辨率遥感数据,已有研究尝试利用无人机自动识别农业景观中的啮齿动物证据,特别是与植被损害相关的迹象。然而,识别田鼠洞穴这样的离散小目标仍面临巨大挑战——如何从复杂的野外图像中准确估计洞穴的位置和分类?
在这一背景下,来自萨拉曼卡大学环境与农业科学学院的研究团队在《Smart Agricultural Technology》上发表了一项创新研究,比较了深度学习(DL)与传统监督分类方法在自动检测和量化常见田鼠洞穴方面的性能。研究人员使用高分辨率无人机影像,在两种飞行高度(15米和25米)下,系统评估了不同方法的检测效果。
研究团队主要采用了以下几种关键技术方法:首先,在西班牙巴利亚多利德省的Cuenca de Campos市的一块紫花苜蓿田中进行实地数据采集,使用高精度GNSS设备测量了1154个田鼠洞穴和5个地面控制点(GCP)的地理位置。其次,利用大疆Inspire 1四旋翼无人机搭载禅思X3 RGB相机,分别进行15米和25米飞行高度的航拍任务,生成地面采样距离(GSD)为0.6厘米和1.1厘米的RGB正射影像。第三,采用Mask R-CNN(区域卷积神经网络)这一实例分割模型进行深度学习检测,该模型不仅能检测图像中的物体,还能为每个检测到的实例生成高质量的分割掩码。同时,研究还对比了随机森林(RF)和支持向量机(SVM)这两种传统分类方法的表现,包括像素导向(PO)和对象导向(OO)两种分类策略。最后,通过精确度(P)、召回率(R)和F1分数等指标系统评估了各方法的性能。
3.1. 计算性能
深度学习方法的计算时间主要集中在物体检测阶段,15米影像处理耗时1小时36分钟,25米影像处理耗时40分钟,训练阶段分别需要25分钟和17分钟。相比之下,分类方法的计算时间可以忽略不计,但其主要限制在于为四个类别选择训练区域这一更长更复杂的任务。
3.2. 检测结果的视觉评估
深度学习方法的检测效果显著优于传统分类方法。在15米和25米影像上,DL分别仅产生56个和40个误报(FP),而最佳分类配置(OO二类SVM和OO四类RF)分别产生1500个和2037个误报。一些较小的洞穴被遗漏,但整体检测效果良好。像素导向分类图中检测到的洞穴数量明显多于DL方法,尤其是在25米影像上,但代价是误报数量极高(最多达25324个),许多暗区(如阴影)由于其可见光范围内的相似光谱响应而被误分类为洞穴。对象导向分类中的多边形更贴合实际洞穴形状,改善了 delineation,但识别为洞穴的多边形较少,导致误报较少但漏报(FN)较多,尤其是在25米影像上。
3.3. 检测精度的定量验证
3.3.1. DL性能
深度学习在检测常见田鼠洞穴方面表现出强劲性能。高数量的真阳性(TP)表明模型正确识别了大多数洞穴。DL-25m模型的精确度略高(0.94),但召回率较低(0.74),表明在较粗糙分辨率下模型更保守,避免了误报但遗漏了更多洞穴。相比之下,DL-15m识别出更多真实洞穴(漏报更少),召回率达到0.81,总体F1分数更高(0.86对0.83)。
3.3.2. 监督分类性能
分类方法的性能明显低于DL。RF和SVM都难以平衡精确度和召回率,特别是在25米分辨率下,由于误报数量大,导致F1分数非常低。对象导向分类比像素导向分类实现了更好的平衡,提供了更高的精确度和F1分数。RF通常在精确度方面优于SVM,产生的误报更少,F1分数更高,尤其是在15米分辨率下。SVM达到更高的召回率值但产生更多误报,导致F1分数更低。
3.4. 对象导向分类对类别数量的敏感性
使用仅包含洞穴和非洞穴两个类别的简化分类方案进行评估,结果显示整体评估指标与四类别分类获得的结果相当,特别是在15米飞行影像上结果显著改善。考虑到二类别分类显著减少了训练阶段的工作量,且结果相当甚至略有改善,二类别策略优于四类别方案。
3.5. 空间分辨率的影响
空间分辨率对所有方法的性能都起着重要作用。15米影像持续改善结果,特别是对于分类方法。在像素导向分类中,15米下的RF在精确度和F1分数(分别为0.30和0.45)上相比25米下的极低值(0.03和0.05)有显著提升。对象导向分类也受益于更高的分辨率,实现了更好的洞穴 delineation 以及精确度和召回率之间更好的平衡。
研究的讨论部分指出,深度学习方法在检测农业区域田鼠洞穴方面优于对象导向分类技术,主要归因于其捕捉复杂空间特征和模式的能力。传统分类方法产生的大量误报限制了其实际应用。植被覆盖对检测精度有显著影响——当田鼠侵扰减少或消除了植被,暴露出土壤扰动时,洞穴能被有效识别;但当作物茂密时,检测性能显著下降。飞行高度和图像分辨率在检测性能中起着关键作用,较低飞行高度带来的更高空间分辨率提升了检测性能,但也增加了处理时间。
研究还揭示了在商业地理信息系统(GIS)软件环境中操作深度学习模型的技术限制,包括集成问题和高计算需求。尽管文献通常认为深度学习在训练数据准备和计算需求方面成本高昂,但本研究发现对象导向分类(特别是四类别)同样需要大量工作和时间。数据集的分配采用30%(训练)和70%(验证)的分割方式,主要是受操作限制驱动,但深度学习模型仍实现了高精确度和有竞争力的F1分数,表明工作流程在这些条件下是稳健的。
关于田鼠密度,研究区域表现出严重侵扰,大约每两平方米一个洞穴,这与先前关于田鼠爆发期间洞穴密度的报告一致。最后,敏感性分析表明,减少类别数量可以在保持相当精度的同时显著减少工作量,这在需要快速模型开发和部署的操作环境中特别相关。
研究的结论部分强调,深度学习通过大幅减少误报数量,在检测田鼠洞穴方面明显优于分类方法。虽然分类方法达到了合理的召回率和真阳性率,但过多的误报显著降低了其精确度和F1分数。改进的空间分辨率提高了两种方法的检测性能,增加了真阳性率并提升了所有评估指标。具体而言,用15米影像训练的深度学习模型在精确度和召回率之间提供了更好的平衡,而25米模型更保守,偏向精确度而牺牲了召回率。
这些发现证实,在本研究的具体条件下,深度学习方法对于检测相对明确、孤立的物体(如田鼠洞穴)特别有效。未来研究应侧重于将洞穴计数与田鼠种群估计联系起来,从而实现更有效的鼠害管理策略。该工作流程易于转移到不同的农业环境、作物类型和土壤条件,后续研究应优先进行多地点测试,以评估其在更广泛场景下的普适性。
这项研究不仅为农业鼠害监测提供了新的技术路径,也为深度学习在精准农业中的应用开辟了新的方向。通过将先进的计算机视觉技术与无人机遥感相结合,研究人员成功实现了对田鼠洞穴的高精度自动识别,为农业生产中的病虫害早期预警系统提供了重要技术支撑。随着技术的进一步优化和推广,这种基于深度学习的检测方法有望在全球范围内改善农业鼠害管理实践,减少化学农药的使用,促进可持续农业发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号