《Artificial Intelligence in Agriculture》:A hierarchical framework for cotton boll opening rate monitoring using UAV RGB imagery
编辑推荐:
本研究针对传统棉铃吐絮率(CBOR)监测方法效率低、主观性强的问题,开发了一种结合无人机(UAV)RGB影像的分层监测框架。通过改进TransUNet模型(集成CBAM注意力模块与DySnakeConv卷积),实现了棉花像素比例(CPR)的精准提取(精度92.15%),并结合植被指数与纹理特征,利用随机森林(RF)分类器实现了CBOR的自动化分级(F1-score达84.32%)。该研究为精准农业中的收获决策和变量喷施提供了可靠的技术支持。
棉花作为全球最重要的经济作物之一,其产量和纤维质量直接影响纺织工业及相关供应链。棉铃吐絮率(Cotton Boll Opening Rate, CBOR)是反映棉花成熟度的关键农艺指标,准确评估CBOR对确定脱叶剂喷施时机和机械采收窗口至关重要。然而,传统人工观测方法效率低下且主观性强,难以满足大范围田间监测需求。随着无人机(Unmanned Aerial Vehicle, UAV)遥感技术的发展,高分辩率时空影像为棉花生长状态监测提供了新机遇,但复杂田间背景和棉铃边缘模糊等问题仍制约着监测精度。
为解决上述挑战,吉林大学研究团队在《Artificial Intelligence in Agriculture》发表题为"A hierarchical framework for cotton boll opening rate monitoring using UAV RGB imagery"的研究论文,开发了一种结合改进TransUNet分割与机器学习分类的分层监测框架。该研究通过集成卷积块注意力模块(Convolutional Block Attention Module, CBAM)和动态蛇形卷积(Dynamic Snake Convolution, DySnakeConv)的TransUNet模型,实现了棉花像素的精准分割,并首次将棉花像素比例(Cotton Pixel Ratio, CPR)与植被指数、纹理特征融合,利用随机森林(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)分类器实现了CBOR的自动化分级。
研究团队在关键技术方法上主要采用:基于无人机RGB影像数据采集(DJI Matrice 300 RTK搭载Zenmuse P1传感器,飞行高度25米,分辨率8192×5460像素);改进的TransUNet分割架构(集成CBAM和DySnakeConv模块);多特征融合策略(CPR、15种植被指数和24种纹理特征);机器学习分类模型(RF和SVM的网格搜索优化);以及严格的统计验证(Pearson相关性分析和5折交叉验证)。实验在山东滨州棉区开展,覆盖3个关键生长时期(9月20日、9月27日、10月8日),共获取240个样方CBOR测量数据。
3.1. 图像分割模型结果分析
改进TransUNet在棉花像素分割任务中显著优于U-Net、DeepLabV3+和PSPNet等基准模型,精确度达92.15%,交并比(Intersection over Union, IoU)为85.27%。可视化结果显示该模型能有效区分棉铃与复杂背景,减少叶片反光和土壤干扰导致的误判。
3.2. 提取CPR的统计分析
CPR值与田间实测CBOR呈现强相关性(相关系数r=0.84-0.89),且随时间推移呈现规律性增长趋势(9月20日:3.6%-5.8%;10月8日:20.9%-25.9%),证实CPR可作为CBOR的可靠代理指标。
3.3. 遥感图像特征与CBOR的相关性分析
在15种植被指数和24种纹理特征中,CPR与CBOR的相关性最强,而基于红色波段的纹理特征(如R_Mean)也表现出较高相关性(|r|=0.67-0.88),验证了多特征融合的有效性。
3.4. CBOR分类模型结果分析
RF分类器在三个时期的平均F1-score(80.78%、84.32%、83.09%)均优于SVM(72.74%、80.54%、78.42%),Wilcoxon符号秩检验表明差异显著(p<0.001)。L4级别(吐絮率75%-100%)的分类精度最高(RF:89.55%),而L3级别因样本不平衡和特征模糊性存在较多误分。
3.5. CBOR分类的田间分布图
空间分布结果显示,CBOR等级从9月20日的分散分布逐步过渡到10月8日的L4主导格局,清晰反映了棉田吐絮进程的空间异质性,为分区管理提供了依据。
4.1. 基于单日期数据集的分割模型性能分析
多时期数据联合训练使模型F1-score提升17.61%,显著优于单日期训练结果,证实了数据多样性对模型泛化能力的重要性。9月27日因叶片脱落减少背景干扰,模型性能最优(F1-score 74.43%)。
4.2. 不同注意力机制的对比和消融实验
CBAM在多种注意力机制中表现最佳(F1-score 89.88%),其通道与空间注意力协同作用提升了特征选择性。消融实验表明,CBAM与DySnakeConv的联合使用使IoU提升至85.27%,较基线模型提升5.7个百分点。
研究结论表明,该分层框架通过改进TransUNet实现精准CPR提取,并结合多特征机器学习分类,为CBOR监测提供了自动化解决方案。讨论部分指出,CPR作为形态学指标在吐絮期比生理性植被指数更具优势,而RF分类器在高维特征交互处理上表现稳健。尽管存在单一年份数据和顶视角影像局限,该研究为精准农业中的变量喷施和收获调度提供了实用化技术支撑,未来将通过多地区验证和多视角成像进一步优化模型普适性。