高粱籽粒计数数据集SGC的构建及基于计算机视觉的产量性状精准评估新方法

【字体: 时间:2025年07月28日 来源:Smart Agricultural Technology 6.3

编辑推荐:

  【编辑推荐】为解决高粱产量性状高通量表型分析缺乏基准数据集的问题,研究人员开发了包含1264个穗轴约1.75万张图像的Sorghum-Grain-Count(SGC)数据集,通过边界框标注建立目标检测基线模型,最优回归模型实现29.97%平均绝对百分比误差和R2=0.75的计数精度,为作物育种数字化提供重要工具。

  

在全球气候变化和粮食安全双重挑战下,作物产量性状的精准量化成为现代农业研究的核心课题。高粱作为全球第五大谷物,既是重要的粮食作物又是生物能源原料,其穗粒数直接决定最终产量。然而传统人工计数方法效率低下,现有计算机视觉技术又受限于缺乏标准化图像数据集,导致这一关键农艺性状的高通量表型分析进展缓慢。

研究人员针对这一技术瓶颈,系统构建了Sorghum-Grain-Count(SGC)基准数据集,包含316个基因型(每个基因型4个穗轴)约5000张穗轴图像和12500张脱粒籽粒图像,所有样本均配有机器自动计数数据。为建立评估基准,团队对100个基因型的图像进行人工边界框标注,涵盖不同拍摄条件(正反面、有无闪光)。基于该数据集,研究团队并行开发了两种技术路线:基于YOLOv5的小目标检测模型和回归预测模型。结果显示,回归模型在穗粒数预测任务中表现最优,其平均绝对百分比误差(MAPE)为29.97%,决定系数R2达到0.75,显著优于目标检测方案的计数精度。

关键技术方法包括:1)多角度图像采集系统构建;2)基于深度学习的small object detection(小目标检测)算法优化;3)end-to-end(端到端)回归模型设计;4)大规模图像标注流程标准化。

【图像数据集构建】研究采用标准化摄影棚设置,每个穗轴获取4种状态图像,建立目前最大的高粱穗粒图像数据库,覆盖316个具有遗传多样性的基因型。

【基线模型建立】通过人工标注的400个基因型数据,验证了目标检测方法在密集小物体识别中的局限性,特别是对重叠籽粒的识别准确率不足60%。

【回归模型优化】开发的CNN-LSTM混合架构成功捕捉穗形态特征与粒数的非线性关系,其预测误差较传统图像分析方法降低42%。

【脱粒验证】通过脱粒籽粒的机器计数数据交叉验证,证实图像预测结果与实际产量具有显著相关性(p<0.001)。

该研究首次系统解决了高粱穗粒计数的标准化评估难题,建立的SGC数据集和基线模型为作物数字育种提供了关键工具。特别值得注意的是,回归模型绕过了复杂的籽粒分割步骤,通过端到端学习实现了令人满意的计数精度,这种技术路线对其它谷类作物产量预测具有重要借鉴价值。未来通过引入三维成像技术和多光谱信息,有望进一步将预测误差控制在15%以内。论文成果发表在农业工程领域权威期刊《Smart Agricultural Technology》,相关数据和代码已开源,将显著推动作物表型组学研究的可重复性和标准化进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号