YOLO-MSS:一种用于高密度多物种镰刀菌孢子检测的轻量化多尺度检测模型

《Smart Agricultural Technology》:YOLO-MSS: A Lightweight Multi-Scale Detection Model for Dense Multi-Species Fusarium Spores

【字体: 时间:2026年06月13日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  镰刀菌穗腐病(FHB)对全球小麦生产构成严重威胁,而对孢子的精确检测对于早期预警和精准管理至关重要。然而,显微检测仍然极具挑战性,因为孢子通常表现为尺寸极小且密集聚集,图像中还存在黏连与遮挡现象,同时类别间差异细微、类别内变异显著,使得在复杂背景下实现可靠检测

  
镰刀菌穗腐病(FHB)对全球小麦生产构成严重威胁,而对孢子的精确检测对于早期预警和精准管理至关重要。然而,显微检测仍然极具挑战性,因为孢子通常表现为尺寸极小且密集聚集,图像中还存在黏连与遮挡现象,同时类别间差异细微、类别内变异显著,使得在复杂背景下实现可靠检测与分类尤为困难。为更好反映实际场景中镰刀菌孢子的这些特征,研究人员构建了一个包含3种代表性物种的多类型镰刀菌孢子数据集,命名为Fusarium-SOD数据集(Small, Occluded, and Dense,小目标、遮挡与密集),用于刻画镰刀菌孢子的小目标、遮挡及密集分布特征;并基于YOLOv8n开发了一种高效检测框架YOLO-MSS。该模型引入形态-密度融合卷积(MDFConv)模块,以增强对小型密集目标的特征表征;将序列融合注意力(SFA)机制集成至C2f结构中,以提升特征判别能力;并采用用于边界框(BBox)的尺度动态损失(SDB)以稳定不同尺度下的定位性能。实验结果表明,YOLO-MSS取得了97.3%的mAP@0.5,Precision和Recall分别达到94.1%和95.1%。同时,该模型保持了轻量化设计,模型大小仅6.15 MB,推理速度达到94 FPS,从而满足实时孢子监测与硬件部署的实际需求。
该论文发表于《Smart Agricultural Technology》,聚焦于小麦镰刀菌穗腐病(FHB)病原孢子的显微自动检测问题。研究背景在于,FHB是全球小麦生产中破坏性极强的真菌病害之一,不仅会造成产量和品质下降,还会因产毒镰刀菌产生真菌毒素而威胁食品安全与人体健康。该病主要通过空气传播孢子扩散,因此对镰刀菌孢子的及时、准确识别,是病害早期预警、精准植保和风险管理的重要基础。现有农业监测系统中,孢子检测仍主要依赖显微观察和人工计数,虽然这是常用参照标准,但其劳动强度大、耗时长、依赖经验且重复性不足。传统图像处理方法虽然尝试通过阈值分割、边缘提取和形态学操作实现自动识别,但在复杂显微环境下,易受背景变化、杂质干扰和光照不均影响,尤其难以处理尺寸极小、分布密集且存在遮挡黏连的孢子目标。深度学习目标检测技术,尤其是YOLO系列,虽然在农业视觉中展现出较好的速度与精度平衡,但既有研究多聚焦于单一孢子类型或固定尺度成像条件,在多物种、多尺度和复杂背景条件下的泛化能力仍然不足。因此,研究人员开展本研究,旨在构建更贴近真实显微场景的数据集,并设计兼顾轻量化、实时性与检测精度的多尺度孢子检测模型。

为解决上述问题,研究人员首先构建了Fusarium-SOD数据集,包含3种代表性镰刀菌孢子:Fusarium graminearum(Fg)、Fusarium pseudograminearum(Fk)和Fusarium redolens(Fr)。图像在100×与400×两种总放大倍数条件下采集,共获得1026张显微图像和19569个标注实例,并按照7:2:1划分为训练集、验证集和测试集。研究人员基于YOLOv8n提出YOLO-MSS框架,围绕特征提取、注意力建模和边界框回归三个方面进行针对性改进。研究结论显示,该模型在保持轻量化结构的同时,显著提升了对小目标、密集分布、多类别镰刀菌孢子的检测性能,mAP@0.5达到97.3%,较基线YOLOv8n提升2.0%,并兼具94 FPS的实时推理能力和6.15 MB的小模型体积,说明该方法可为实验室尺度自动显微孢子分析和病害监测提供有效技术支撑。

研究人员采用的主要关键技术方法包括:其一,构建来源于显微载玻片采集图像的多类型镰刀菌孢子数据集Fusarium-SOD,并基于LabelImg进行矩形框标注,样本覆盖100×和400×两种成像尺度;其二,以YOLOv8n为基线构建轻量化检测框架,引入形态-密度融合卷积(MDFConv)以联合建模全局上下文、局部形态和密集区域响应;其三,在C2f模块中嵌入序列融合注意力(SFA),增强通道与方向感知空间依赖建模;其四,以尺度动态边界框损失(SDB)替换原有CIoU损失,提升不同尺度目标下的定位鲁棒性;其五,通过亮度调整、噪声注入、随机遮挡、随机旋转、随机裁剪和水平翻转进行数据增强。

在研究结果部分,论文依次从模型结构、模块有效性、性能对比、定性分析和部署可行性几个方面进行了系统验证。

3.1 Overview of the YOLO-MSS detection framework
该部分介绍了YOLO-MSS的总体架构基础。研究人员选择YOLOv8n作为基线,是因为其采用无锚框(anchor-free)检测策略和解耦检测头,能够在保持训练流程简洁的同时兼顾定位与分类性能,并更适合资源受限条件下的实时部署。针对显微孢子极小、密集分布且受背景干扰严重的特点,研究人员在YOLOv8n基础上提出模块化增强设计,通过MDFConv、SFA和SDB分别改进特征提取、特征选择与定位优化,形成YOLO-MSS总体框架。该结果说明研究并非单一替换某一层结构,而是围绕显微孢子检测难点进行系统性协同优化。

3.2 Enhancing Feature Representation through Morphology Density Fusion
该部分提出MDFConv模块,用以解决标准3×3卷积感受野有限、难以同时捕获长程上下文与精细结构的问题。研究人员通过双分支设计,一支采用大核卷积提取全局上下文,增强对复杂背景中孢子的区分能力;另一支通过标准卷积、方向卷积以及Sobel梯度相关特征提取,表征孢子本体及细长结构等形态信息;随后再通过自适应融合机制整合全局与局部信息,并加入密集区域注意力,对孢子聚集区域进行响应增强。对比实验表明,MDFConv在仅3.01M参数量和6.11 MB模型大小下,将mAP@0.5提升至96.7%,优于MobileNetv2、ShuffleNetv2和GhostNetv3等替代卷积策略。这一结果说明,MDFConv在保持轻量化的同时,有效增强了小目标和密集目标的表征能力。

3.3 Sequential fusion attention for small-scale spore perception
该部分围绕显微孢子小尺度感知中的注意力建模展开。研究人员指出,原始C2f模块虽有利于多尺度特征融合与梯度传播,但对通道依赖关系和长距离空间关系的建模能力有限。为此,研究中引入SFA机制,将其嵌入C2f内部形成C2f_SFA模块。SFA通过分组处理、双分支注意力建模以及条带池化(strip pooling)方式,分别强化通道注意力和方向感知空间依赖,使模型更好关注密集、黏连和细长结构中的判别性区域。热图分析显示,相较于原始YOLOv8n、CBAM和SE模块,SFA在孢子区域形成了更集中、更连贯的响应,并显著抑制背景激活。消融实验也表明,仅加入SFA时mAP@0.5提升至95.5%,与MDFConv联合后可进一步提升至96.9%,说明该模块能够有效增强复杂显微背景下的小孢子判别能力。

3.4 Scale-based dynamic loss for robust bounding box regression
该部分提出SDB损失,以改善小目标边界框定位时传统IoU类损失对微小偏差高度敏感的问题。研究人员指出,YOLOv8中采用的CIoU损失对不同尺度目标施加统一权重,不利于多尺度场景中小目标的稳定优化。SDB损失通过引入基于尺度和特征图分辨率的动态调节系数,对定位项和尺度相关约束项进行自适应加权,从而提升小目标回归稳定性。训练曲线显示,SDB虽然未得到最低的回归损失值,但其收敛过程较快且稳定,同时在Recall和mAP@0.5方面表现最佳,说明其优化更加均衡,更适用于显微孢子这类小而密集目标的检测任务。

4.1 Experimental environment and evaluation metrics
该部分给出了实验环境和评估指标。实验运行于Ubuntu 20.04.6 LTS系统,使用NVIDIA Tesla V100-32GB图形处理器(GPU),CUDA版本为12.2,PyTorch为2.5.1,Python为3.9.20。输入图像分辨率固定为640×640,初始学习率设为0.01,训练轮数为500。研究人员采用Precision、Recall、AP、mAP@0.5和mAP@0.5–0.95评估检测性能,并利用平均绝对误差(MAE)、均方根误差(RMSE)、Pearson相关系数(r)和决定系数(R2)评估图像级计数性能。这部分为后续比较提供了统一评价基础。

4.2.1 Performance comparison of different convolution strategies
该部分通过替换YOLOv8n骨干中的标准卷积,对不同卷积策略进行比较,以验证MDFConv的有效性。结果表明,MobileNetv2虽然略微降低参数量,但检测精度降至94.1%;ShuffleNetv2在轻量化方面表现较好,mAP@0.5为95.2%;GhostNetv3可提升至96.6%,但参数和模型体积增加。MDFConv则在3.01M参数量和6.11 MB模型大小下实现最高96.7%的mAP@0.5,显示出最优的精度—效率平衡。该结果证明,面向显微孢子任务设计的卷积模块,比通用轻量网络块更适合复杂显微检测场景。

4.2.2 Performance evaluation of the attention mechanism for small-scale spore detection
该部分通过YOLOv8 Explainer生成的特征响应热图比较不同注意力机制。结果表明,原始YOLOv8n对非目标区域存在较强粗糙响应;CBAM虽能部分突出目标轮廓,但在密集区域响应碎片化;SE增强了目标周边响应,但背景激活仍较明显;SFA则在孢子分布区域形成最集中、最连贯的激活,同时显著抑制背景。由此得出,SFA在方向感知的长距离依赖建模方面更适合显微孢子图像,能够更有效提升定位与区分能力。

4.2.3 Impact of bounding box regression loss on detection accuracy
该部分比较了CIoU、Inner-CIoU、Shape-IoU和SDB四种损失函数的训练动态。结果显示,CIoU初始损失较高,早期收敛较慢;Inner-CIoU和Shape-IoU具有较快收敛和较低最终回归损失;SDB虽然不是回归损失最低者,但在精度上略优,并取得最高的Recall和mAP@50。研究人员据此认为,SDB通过尺度动态加权增强了对不同大小目标的适应性,更适合显微孢子定位优化。

4.3 Ablation experiments of key modules in YOLO-MSS
该部分系统评估了MDFConv、SFA和SDB三个关键模块的独立与组合贡献。基线YOLOv8n的mAP@0.5为95.3%。仅加入MDFConv后提升至96.7%;仅加入SFA后提升至95.5%;仅加入SDB时mAP@0.5保持95.3%,说明其单独对总体检测精度提升不显著,但可作为定位优化补充。组合实验表明,MDFConv+SFA达到96.9%,MDFConv+SDB达到96.8%,SFA+SDB为95.8%;三者全部结合时达到最优性能:Precision为94.1%,Recall为95.1%,mAP@0.5为97.3%,mAP@0.5–0.95为78.80%,模型参数为3.02M,模型大小为6.15 MB。训练曲线也显示YOLO-MSS在Precision、Recall及两项mAP指标上均持续优于基线。该部分结果说明,三个模块具有互补性,其联合使用带来了稳定而显著的性能收益。

4.4 Comparison with state-of-the-art detection models
该部分将YOLO-MSS与Faster R-CNN、RT-DETR以及YOLOv5n、YOLOv10n、YOLOv11n、YOLOv12n等方法进行比较。结果显示,两阶段检测器参数量和计算复杂度更高,但在显微孢子检测上的准确率较低;YOLOv5n速度最快且最轻量,但mAP@0.5仅为94.1%;YOLOv10n在基线模型中精度最高,为95.4%,但模型体积较大;YOLOv11n和YOLOv12n精度和效率均无明显优势。YOLO-MSS以97.3%的mAP@0.5取得最高检测精度,同时保持3.02M参数量、6.15 MB模型大小和94 FPS推理速度。研究结果表明,该方法在准确率与部署可行性之间实现了更优折中。

4.5 Qualitative analysis of small-scale spore detection accuracy
该部分从类别级性能、混淆矩阵、图像级计数和可视化结果等角度分析模型表现。类别检测结果显示,YOLO-MSS对Fg、Fr和Fk三类孢子均有提升,其中Fr提升最显著,AP@0.5从90.5%提高至94.6%,AP@0.5–0.95从61.5%提高至69.9%,说明模型对形态差异微弱且类内变异较大的类别具有更好判别能力。混淆矩阵显示,YOLO-MSS减少了背景混淆和漏检,例如Fr被误判为背景的比例由约10%降至5%。图像级计数分析表明,YOLO-MSS的MAE为2.16、RMSE为3.60、Pearson r为0.993、R2为0.977,较YOLOv8n具有更好的计数一致性与稳健性。不同类别、不同光照和不同密度场景下的可视化结果进一步显示,YOLO-MSS在小目标、密集分布、局部遮挡和光照不均条件下,能够减少漏检与误检,并在拼接的多类别复合场景中保持稳定检测。这些结果共同证明,该模型具备较强的实际显微监测应用潜力。

4.6 Deployment Feasibility Analysis
该部分讨论模型的应用部署可行性。研究人员设计了一个概念验证型孢子监测与基于计数预警的系统框架,包括孢子捕集装置、云端处理平台、Web端分析系统和移动端小程序四部分。显微图像由捕集设备采集后传输至处理单元,通过YOLO-MSS完成孢子检测,并根据孢子数量和类别分布输出初步预警结果。模型支持边缘端与云端两种推理模式:边缘部署可降低通信开销并实现低时延推理,云端部署则适合多站点集中处理。论文指出,该系统已成功部署于云平台,表明所提模型可嵌入自动化监测流程,但当前预警仍基于预设孢子计数阈值,后续还需结合持续田间监测、环境变量和病害发生记录进行进一步验证。

讨论部分指出,YOLO-MSS针对显微镰刀菌孢子检测中的小目标、高密度分布和尺度变化问题,采用特征提取、注意力建模和定位优化的联合改进策略,因而在多尺度、多类型孢子检测中取得了一致性能提升。与基于手工特征和阈值分割的传统方法相比,该框架能够从数据中学习层次化表示,更能适应背景复杂性、光照变化和孢子聚集情况;与已有深度学习孢子检测模型相比,该方法在混合尺度和多类别场景下显示出更强鲁棒性。研究人员同时明确指出了研究局限:数据集获取条件相对受控,涵盖的镰刀菌物种范围有限,可能限制模型向更复杂田间环境的泛化;在极端密集黏连和形态相似条件下,仍可能出现漏检。未来工作将扩展数据集的病原种类、成像条件和跨域数据,并尝试将孢子检测与菌丝分割、时间序列分析等下游任务结合,构建更完整的显微病原分析系统。

研究结论部分可概括翻译如下:本研究提出了一种用于小麦镰刀菌穗腐病(FHB)孢子显微检测的高效检测框架YOLO-MSS。通过在YOLOv8n架构中引入MDFConv模块、C2f_SFA模块和SDB损失,所提模型提升了对小型、密集分布目标的特征表征、注意力建模和定位性能。实验结果表明,与基线模型相比,YOLO-MSS在mAP@0.5上实现了稳定的2.0%性能提升,同时Precision和Recall也得到改善。这些结果表明,该框架可为自动化显微孢子分析和实验室尺度病害监测提供技术支持。未来将进一步推动该方法与田间孢子捕集系统融合,并评估其在复杂环境条件下的鲁棒性,以持续拓展其在智能植物病害监测和精准农业中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号