
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于轻量化深度神经网络YOLOv9-LDS的复杂田间环境下小麦穗轮廓检测与表型分类研究
【字体: 大 中 小 】 时间:2025年08月23日 来源:Plant Methods 4.4
编辑推荐:
本研究针对复杂田间环境下小麦穗轮廓精确提取与表型分类的技术难题,提出改进的YOLOv9-LDS算法。通过构建轻量化深度可分离网络(LDSNet)和高效局部注意力(ELA)模块,结合SloU损失函数优化,实现mAP@0.5达92.4%、FPS提升31.7%的突破性性能,为小麦自动化产量估算提供高精度轻量化解决方案。
在粮食安全与精准农业的背景下,小麦产量预测的核心参数——穗粒数的自动化统计一直是农业信息化的难点。传统人工计数方法效率低下且误差率高,而现有计算机视觉技术面临复杂田间环境中穗叶粘连、光照变化等挑战,导致轮廓提取完整性不足(仅85%左右)和表型分类错误。尤其当小麦进入灌浆期后,穗粒腹面(SpikeGrainSurface)与颖片面(SpikeletSurface)的形态差异(前者呈三棱柱状排列,后者为双排结构)更增加了算法设计的复杂度。
针对这些痛点,河南农业大学团队在《Plant Methods》发表研究,通过两年田间试验采集3个小麦品种(新麦26、科兴3302、郑麦136)的6,572张多角度图像,构建改进的YOLOv9-LDS框架。关键技术包括:1)基于MobileNetV4架构设计轻量化LDSNet主干网络,采用通道重参数化技术降低45.3%计算量;2)引入高效局部注意力(ELA)模块增强边缘特征响应;3)创新性使用SloU损失函数优化边界框回归;4)增加小目标检测层处理密集穗粒区域。
模型架构创新
研究团队将原YOLOv9-C的主干网络替换为自主设计的LDSNet,其核心是通用倒置瓶颈(UIB)结构和深度可分离卷积(EDWConv)。如图4所示,该网络在2-7层采用5×5/3×3卷积核交替策略,配合硬Sigmoid激活函数,实现GFLOPs降至55.8的同时保持85.1% mAP。

特征增强机制
如图5所示,ELA模块通过条带池化策略分别提取水平和垂直特征向量,采用5/7尺寸的1D卷积处理空间偏移特征,使重叠穗粒区域的定位误差降低18.6%。与常规坐标注意力(CA)相比,该设计对灌浆期小麦的随机水平排列具有更强适应性。

多阶段验证结果
在灌浆早、中、晚三期测试中(图7),改进模型展现出稳定的轮廓提取能力。如图8所示,其R2达到0.94(穗粒面)和0.92(颖片面),显著优于基线模型。特别是对科兴3302品种的漏检率仅1.23%,验证了跨品种泛化性。

研究结论表明,该框架在保持133 FPS实时性能的同时,将轮廓完整识别率提升至83.9%,较传统方法减少27.6%误检。讨论部分指出,未来可通过多光谱数据融合增强恶劣天气下的鲁棒性,结合TensorRT量化技术满足<50ms延迟的农机嵌入式部署需求。这项研究为作物表型组学从实验室走向田间应用提供了可扩展的算法范式。
生物通微信公众号
知名企业招聘