基于改进YOLOv11与无人机遥感图像的松材线虫病检测方法YOLOv11-OC

《Ecology and Evolution》:A Detection Method of Pine Wilt Disease Based on Improved YOLOv11 With UAV Remote Sensing Images

【字体: 时间:2025年12月29日 来源:Ecology and Evolution 2.3

编辑推荐:

  本文提出了一种基于改进YOLOv11(YOLOv11-OC)的松材线虫病(PWD)检测方法。该方法通过引入全维动态卷积(ODConv)优化C3K2模块,增强了模型对小目标和早期病斑的特征提取能力;同时,结合上下文锚点注意力(CAA)机制改进C2PSA模块,提升了模型在复杂背景下的上下文感知能力,有效降低了漏检率。实验结果表明,YOLOv11-OC在PWD数据集上精确度(P)达94.2%,平均精确度均值(mAP50)达88.9%,显著优于原始YOLOv11及其他主流模型,并在公开PlantDoc数据集上展现出良好的泛化能力,为森林病害智能监测提供了可靠的技术方案。

  
摘要
松材线虫病(Pine Wilt Disease, PWD),又称松树萎蔫线虫病,是由松材线虫(Bursaphelenchus xylophilus)引起的一种严重森林病害,在中国传播迅速并造成严重生态破坏。然而,现有检测方法在识别早期感染树木时准确率较低,且易出现漏检。为解决这些问题,本研究提出YOLOv11-OC,一种基于改进YOLOv11与无人机(UAV)遥感图像的松材线虫病检测方法。采用全维动态卷积(Omni-dimensional Dynamic Convolution, ODConv)优化C3K2模块,从而增强对小目标的特征提取能力,提高早期病害区域的识别准确率。同时,引入上下文锚点注意力(Context Anchor Attention, CAA)机制改进C2PSA模块,增强模型的上下文感知能力,有效减少漏检,并提升在复杂背景下的检测性能。实验结果表明,所提出的YOLOv11-OC算法优于原始YOLOv11,实现了94.2%的精确度(Precision, P)、83.1%的召回率(Recall, R)、88.3%的F1分数(F1-score)和88.9%的平均精确度均值(mean Average Precision, mAP50)。与原始算法相比,改进版本的精确度提高了2.8%,F1分数提高了1.0%,mAP提高了1.4%。此外,该算法在公开的PlantDoc数据集上也表现出良好的泛化能力。
1 引言
中国森林资源丰富,森林覆盖广泛,这对生态保护、经济发展、气候调节和生物多样性保护具有重要作用。然而,自1982年松材线虫首次传入中国以来,森林资源面临严重威胁。松材线虫是一种微小的蠕虫,主要通过松褐天牛(Monochamus alternatus)等媒介昆虫传播。该线虫在松树木材部繁殖,阻塞水分和养分运输,导致树木萎蔫死亡。PWD传播迅速,严重影响松树健康,导致树木萎蔫死亡和大规模森林退化,不仅造成林业生产和经济效益的巨大损失,还带来深远的生态破坏,削弱森林生态系统的稳定性、碳汇能力以及水土保持能力。因此,科学防控PWD感染树木已成为当务之急。
近年来,无人机遥感技术发展迅速。目前,检测PWD感染树木的主要方法包括人工野外调查和基于无人机图像的检测。然而,人工检测主要依靠人眼区分病树颜色变化,主观性强,且难以高效、全面地覆盖大面积林区。相比之下,无人机图像检测具有显著优势,能在短时间内高效获取大区域数据,并利用高分辨率图像准确识别感染树木,大大提高了检测效率和准确性。
越来越多的研究者将无人机遥感与深度学习技术相结合,显著提高了PWD感染树木的检测准确性。例如,Wu和Jiang(2023)提出了一种基于改进Mask R-CNN和ConvNeXt的PWD检测方法;Zhu等人(2024)提出了一种基于改进YOLOv7的PWD检测方法;Yao, Song等人(2024)开发了一种名为Pine-YOLO的PWD检测方法;Su等人(2024)提出了名为PWD-YOLOv8n的检测方法;Yuan等人(2025)提出了名为YOLOv8-RD的PWD检测方法;Ren等人(2025)引入了名为MASFNet的PWD树木检测方法。然而,这些研究在复杂背景下的检测准确性仍有待提高,且在处理树枝遮挡、感染树木复杂形态等问题时仍存在一定漏检率。
因此,本研究提出一种基于改进YOLOv11与无人机遥感图像的松材线虫病检测方法。具体而言,通过将全维动态卷积(ODConv)和上下文锚点注意力(CAA)模块集成到YOLOv11架构中,开发了一种名为YOLOv11-OC的检测模型,能够有效检测PWD感染树木。所提出的改进增强了模型提取小目标特征(Kang 2022; Yao, Lin等人 2024)和复杂环境中长距离病害区域的能力。ODConv模块通过多维度注意力机制自适应调整卷积核权重,从而增强模型提取小目标和复杂目标特征的能力,减少信息损失,使模型即使在挑战性条件下也能准确捕捉关键特征。CAA模块提高了模型捕捉长距离病害区域特征的能力,有效解决了树枝遮挡、感染树木复杂形态和环境噪声等问题,最终减少了漏检。总体而言,改进的YOLOv11-OC模型在PWD感染树木检测任务中表现出更高的检测准确性和更强的环境适应性。
2 材料与方法
2.1 研究区域选择
研究区域位于中国西部林区。使用搭载机载相机的DJI无人机作为飞行平台,收集松材线虫病感染树木的数据,如图1所示。在数据采集过程中,光照不足会导致图像过暗,影响病树识别准确性。为确保充足光照并尽量减少无关因素的影响,本研究中的所有数据图像均在晴朗天气上午10:00至下午5:00之间采集。此外,为保持图像一致性,数据采集全程使用同一无人机型号,并在固定飞行高度进行航空摄影。
2.2 数据集构建
本研究选择无人机航空图像中捕获的PWD感染树木作为研究对象。收集的图像被裁剪成固定大小的像素块以构建数据集。在数据集中,树木PWD的进展分为四个主要阶段(Shi等人2024),如图2所示。如图2所示,PWD的进展分为四个阶段:(a)早期感染阶段:此阶段症状尚不明显,树冠部分可能出现轻微变色。(b)病害扩展阶段:树木针叶逐渐失去绿色,变黄或变红,树木生长停滞或开始衰退。(c)严重感染阶段:树木呈现明显萎蔫或红褐色外观,木材组织开始腐烂。(d)死亡阶段:松树完全死亡,所有针叶脱落,树皮脱落或出现可见裂缝,树干木材严重腐烂。
为扩展数据集,应用了多角度旋转和亮度调整等数据增强技术。在此基础上,在林业科学院专家的指导下,使用公开标注工具对数据集中的所有病树进行单独标注。标注完成后,生成一个label.txt文件存储所有标签信息,便于后续模型训练和分析。数据集标注示例如图3所示。
数据集的质量直接影响模型的学习性能和泛化能力。确保数据集具有足够的代表性和多样性,覆盖不同场景和条件,有助于模型更好地理解和捕捉数据中的关键特征,从而提高其在真实应用中的性能和准确性。本研究选择的PWD感染树木数据集的具体信息如表1所示。
2.3 检测方法
2.3.1 YOLOv11-OC检测算法
本研究首先将YOLOv3、YOLOv5、YOLOv8和YOLOv11应用于自建数据集中的树木检测。结果表明,YOLOv11在检测PWD感染树木方面表现最佳。因此,选择YOLOv11作为本研究的基线模型进行进一步研究。
YOLOv11由Ultralytics于2024年4月发布,是一种高效的目标检测模型,采用三部分架构:Backbone、Neck和Head。与先前版本相比,它在速度和效率上均有显著提升。YOLOv11引入C3k2模块以优化卷积计算并增强特征表示。该模型融合C2PSA注意力机制以有效捕捉上下文信息。其Neck结合了FPN和PAN结构,集成SPPF和C2PSA模块以增强多尺度特征聚合。总体而言,YOLOv11提供了更高的帧率和平均精确度,使其适用于高性能计算和边缘设备部署。
然而,使用YOLOv11检测松材线虫病感染树木时出现了一些挑战。一方面,对于小的早期病树区域,YOLOv11难以有效提取关键特征。另一方面,YOLOv11的卷积模块倾向于聚焦局部特征提取,难以捕捉PWD在不同树木区域的长程关系信息,导致漏检。为解决这些挑战,本研究提出一种基于YOLOv11的无人机遥感图像检测方法,称为YOLOv11-OC,如图4所示。红色虚线框突出了该模型中的修改模块区域。
提出的YOLOv11-OC模型通过两种主要方式提升了PWD感染树木的检测性能。一方面,全维动态卷积(ODConv)模块通过使用多维度注意力机制自适应调整卷积核权重来改进C3K2,从而增强模型提取小目标特征的能力。另一方面,引入上下文锚点注意力(CAA)模块改进C2PSA模块,提升了模型捕捉PWD感染树木长程特征的能力,减少了漏检。这些改进进一步提高了检测准确性,特别是在涉及树枝遮挡、复杂树木形态和环境干扰的挑战性场景中。
2.3.2 引入全维动态卷积:C3K2 ODConv
为解决YOLOv11无法有效提取早期小病树关键特征的问题,通过融入全维动态卷积(ODConv)模块来改进C3k2模块。此增强利用多维度动态权重加强模型提取小目标特征的能力。
YOLOv11中传统的C3k2模块仅依赖标准卷积,导致忽略小目标病害区域的特征。本研究采用全维动态卷积(ODConv)(Li等人2022),该模块通过多维度动态权重分配,能够更精确地提取PWD的局部和全局特征,从而提高检测召回率。该模块采用多维度注意力机制和并行策略,聚焦四个维度:卷积核维度、空间维度、输入通道维度和输出通道维度。这种方法增强了模型对不同特征的关注,允许更精确定位缺陷区域中的复杂特征,从而提高检测准确性。ODConv的计算公式如下:
y = (αwi* αsi* αci* αfi* Wi) * x (1)
此处,xy分别代表输入和输出特征。*表示卷积操作。Wi代表卷积核。αwi表示卷积核Wi的注意力标量。αfiαciαsi分别是卷积核Wi的空间维度、输入通道维度和输出通道维度的注意力标量。操作表示沿核空间不同维度的乘法。
全维动态卷积(ODConv)模块的工作流程如图5所示。首先,使用全局平均池化(GAP)压缩输入特征,获得长度为C的特征向量。然后通过全连接(FC)层将其映射到降维比为r的低维空间,以降低计算复杂度。接下来,应用ReLU激活函数消除特征的负值,并将所得向量输入四个并行注意力分支。前三个分支使用FC层和Sigmoid激活函数分别计算卷积核空间维度、输入通道和输出通道的注意力标量。第四分支使用FC层和Softmax激活函数计算核数维度的注意力标量。最后,所有四个维度的注意力标量用于与相应卷积核进行加权求和。然后将生成的动态卷积核与输入特征x进行卷积,产生输出特征y
2.3.3 引入上下文锚点注意力:C2PSA CAA
为解决YOLOv11难以捕捉PWD在不同树木区域的长程上下文依赖导致漏检的问题,本研究引入上下文锚点注意力(CAA)机制到C2PSA模块作为改进。
此外,本研究还将三种注意力机制——MLLA(Mamba-like Linear Attention)、CGA(Cascaded Group Attention)和CAA(Context Anchor Attention)——集成到YOLOv11模型中进行比较评估。如表3所示,融入CAA模块的模型在召回率(Recall)和平均精确度均值(mAP)方面实现了优越性能。这些结果进一步证明了CAA模块在增强YOLOv11模型方面的有效性。
上下文锚点注意力(CAA)机制(Cai等人2024)是一种新颖的注意力方法,旨在捕捉长程上下文特征信息。本研究基于其特性将CAA集成到C2PSA模块中,以增强模型检测PWD树木病害区域的能力。C2PSA_CAA模块的结构如图6所示。
上下文锚点注意力(CAA)模块被引入到C2PSA结构内的PSA_Block中。CAA模块的架构如图6所示。首先,通过平均池化层和标准卷积(Conv)操作获得局部区域特征。然后应用核大小为3×3和5×5的深度可分离卷积(DWConv)以减少参数数量,同时增强长程特征识别和提取能力。随后,通过另一个Conv操作整合特征。最后,应用Sigmoid激活函数生成上下文注意力特征。
3 实验与性能分析
3.1 实验配置
实验中,选择Adam优化器来优化神经网络。初始学习率设置为0.001,学习率衰减因子为0.01。模型训练期间,批量大小(Batch Size)设置为4,训练轮数(Epochs)设置为150。所有实验均在相同的实验环境下进行。详细的实验配置如表2所示。
3.2 实验指标
为评估模型在松材线虫病(PWD)树木检测任务中的性能,本研究采用四种常用评估指标:精确度(Precision, P)、召回率(Recall, R)、F1分数(F1-score)和平均精确度均值(mean Average Precision, mAP50)。这些指标从不同角度评估模型的检测性能。具体计算公式如下:
P = TP / (TP + FP) (2)
R = TP / (TP + FN) (3)
F1 = 2 * P * R / (P + R) (4)
AP = ∫01P(R) dR, mAP = (1/N) * Σi=1NAPi(5)
3.3 不同注意力机制的对比实验
本研究将不同的注意力机制——MLLA(Mamba-like Linear Attention)、CGA(Cascaded Group Attention)和CAA(Context Anchor Attention)——引入YOLOv11模型进行对比实验。实验结果如表3所示。
在模
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号