基于无人机RGB影像与分层框架的棉铃吐絮率监测新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Artificial Intelligence in Agriculture》：A hierarchical framework for cotton boll opening rate monitoring using UAV RGB imagery

【字体：大中小】 时间：2026年02月07日 来源：Artificial Intelligence in Agriculture 12.4

编辑推荐：

　　本研究针对传统棉铃吐絮率(CBOR)监测方法效率低、主观性强的问题，开发了一种结合无人机(UAV)RGB影像的分层监测框架。通过改进TransUNet模型（集成CBAM注意力模块与DySnakeConv卷积），实现了棉花像素比例(CPR)的精准提取（精度92.15%），并结合植被指数与纹理特征，利用随机森林(RF)分类器实现了CBOR的自动化分级（F1-score达84.32%）。该研究为精准农业中的收获决策和变量喷施提供了可靠的技术支持。

棉花作为全球最重要的经济作物之一，其产量和纤维质量直接影响纺织工业及相关供应链。棉铃吐絮率(Cotton Boll Opening Rate， CBOR)是反映棉花成熟度的关键农艺指标，准确评估CBOR对确定脱叶剂喷施时机和机械采收窗口至关重要。然而，传统人工观测方法效率低下且主观性强，难以满足大范围田间监测需求。随着无人机(Unmanned Aerial Vehicle， UAV)遥感技术的发展，高分辩率时空影像为棉花生长状态监测提供了新机遇，但复杂田间背景和棉铃边缘模糊等问题仍制约着监测精度。

为解决上述挑战，吉林大学研究团队在《Artificial Intelligence in Agriculture》发表题为"A hierarchical framework for cotton boll opening rate monitoring using UAV RGB imagery"的研究论文，开发了一种结合改进TransUNet分割与机器学习分类的分层监测框架。该研究通过集成卷积块注意力模块(Convolutional Block Attention Module， CBAM)和动态蛇形卷积(Dynamic Snake Convolution， DySnakeConv)的TransUNet模型，实现了棉花像素的精准分割，并首次将棉花像素比例(Cotton Pixel Ratio， CPR)与植被指数、纹理特征融合，利用随机森林(Random Forest， RF)和支持向量机(Support Vector Machine， SVM)分类器实现了CBOR的自动化分级。

研究团队在关键技术方法上主要采用：基于无人机RGB影像数据采集（DJI Matrice 300 RTK搭载Zenmuse P1传感器，飞行高度25米，分辨率8192×5460像素）；改进的TransUNet分割架构（集成CBAM和DySnakeConv模块）；多特征融合策略（CPR、15种植被指数和24种纹理特征）；机器学习分类模型（RF和SVM的网格搜索优化）；以及严格的统计验证（Pearson相关性分析和5折交叉验证）。实验在山东滨州棉区开展，覆盖3个关键生长时期（9月20日、9月27日、10月8日），共获取240个样方CBOR测量数据。

3.1. 图像分割模型结果分析

改进TransUNet在棉花像素分割任务中显著优于U-Net、DeepLabV3+和PSPNet等基准模型，精确度达92.15%，交并比(Intersection over Union， IoU)为85.27%。可视化结果显示该模型能有效区分棉铃与复杂背景，减少叶片反光和土壤干扰导致的误判。

3.2. 提取CPR的统计分析

CPR值与田间实测CBOR呈现强相关性（相关系数r=0.84-0.89），且随时间推移呈现规律性增长趋势（9月20日：3.6%-5.8%；10月8日：20.9%-25.9%），证实CPR可作为CBOR的可靠代理指标。

3.3. 遥感图像特征与CBOR的相关性分析

在15种植被指数和24种纹理特征中，CPR与CBOR的相关性最强，而基于红色波段的纹理特征（如R_Mean）也表现出较高相关性（|r|=0.67-0.88），验证了多特征融合的有效性。

3.4. CBOR分类模型结果分析

RF分类器在三个时期的平均F1-score（80.78%、84.32%、83.09%）均优于SVM（72.74%、80.54%、78.42%），Wilcoxon符号秩检验表明差异显著（p<0.001）。L4级别（吐絮率75%-100%）的分类精度最高（RF：89.55%），而L3级别因样本不平衡和特征模糊性存在较多误分。

3.5. CBOR分类的田间分布图

空间分布结果显示，CBOR等级从9月20日的分散分布逐步过渡到10月8日的L4主导格局，清晰反映了棉田吐絮进程的空间异质性，为分区管理提供了依据。

4.1. 基于单日期数据集的分割模型性能分析

多时期数据联合训练使模型F1-score提升17.61%，显著优于单日期训练结果，证实了数据多样性对模型泛化能力的重要性。9月27日因叶片脱落减少背景干扰，模型性能最优（F1-score 74.43%）。

4.2. 不同注意力机制的对比和消融实验

CBAM在多种注意力机制中表现最佳（F1-score 89.88%），其通道与空间注意力协同作用提升了特征选择性。消融实验表明，CBAM与DySnakeConv的联合使用使IoU提升至85.27%，较基线模型提升5.7个百分点。

研究结论表明，该分层框架通过改进TransUNet实现精准CPR提取，并结合多特征机器学习分类，为CBOR监测提供了自动化解决方案。讨论部分指出，CPR作为形态学指标在吐絮期比生理性植被指数更具优势，而RF分类器在高维特征交互处理上表现稳健。尽管存在单一年份数据和顶视角影像局限，该研究为精准农业中的变量喷施和收获调度提供了实用化技术支撑，未来将通过多地区验证和多视角成像进一步优化模型普适性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号