基于多种提取方法,在河套灌区分支渠道尺度上精细提取种植结构
《Science of Remote Sensing》:Fine extraction of planting structure at branch canal scale in the Hetao Irrigation District based on multiple extraction method
【字体:
大
中
小
】
时间:2025年10月10日
来源:Science of Remote Sensing 5.2
编辑推荐:
作物结构提取与动态分析:基于河套灌区三年遥感监测与机器学习模型研究。采用Sentinel-2数据结合梯度提升树等多提取方法,发现向日葵种植面积年均增长27.47%,玉米种植面积下降66.18%,验证了NDVI指数在作物分类中的有效性,为区域精准农业管理提供数据支撑。
### 河套灌区种植结构精准提取研究综述
河套灌区是中国重要的农业灌溉区域之一,其种植结构的动态变化对区域农业管理和水资源利用具有深远影响。本研究通过在左二干渠进行为期三年的实验,探讨了不同土地利用类型和作物种植结构的变化趋势,提出了基于多步骤提取方法与机器学习模型的结合策略,以提高种植结构识别的准确性。研究不仅揭示了不同土地利用类型和作物在不同时间段内的植被指数(NDVI)变化规律,还评估了不同机器学习模型在种植结构识别中的表现,为精准农业和智能灌溉提供了理论依据和实践参考。
#### 1. 研究背景与意义
随着农业现代化的推进,获取及时、准确的作物类型、面积和空间分布信息对于可持续农业发展至关重要。这些信息不仅有助于作物健康监测、粮食产量预测,还为国家农业政策的调整提供了重要依据。河套灌区位于黄河流域上游,是中国重要的粮食生产基地之一,其农业活动面临土壤盐碱化、耕地碎片化和复杂土地利用类型等挑战。此外,灌区实施的轮作政策导致同一地块每年种植不同的作物,形成了交错分布的种植结构,使得传统的土地利用分类方法难以准确识别。
因此,开发一种高效且高精度的种植结构提取方法成为研究的重点。遥感监测技术因其覆盖范围广、数据获取便捷等优势,成为精准农业中不可或缺的工具。近年来,随着人工智能的发展,机器学习算法在遥感数据处理中的应用日益广泛。这些算法能够高效分析大量遥感数据,识别不同的作物类型。特别是Google Earth Engine(GEE)平台,凭借其强大的数据处理能力和丰富的计算资源,成为种植结构提取的重要工具。
#### 2. 研究区域与实验设计
本研究选取了位于内蒙古自治区乌审旗的右二干渠下游区域作为实验对象。该区域总面积约为1553公顷,东西宽约2.78公里,南北长5.24公里。该区域的气候属于温带大陆性季风气候,特点是全年干燥多风、气温波动大、日照充足、蒸发量高,降水集中在6月至8月。研究中将作物分为三类:向日葵、玉米和其他作物。
实验从2022年持续至2024年,期间在不同时间点设置了不同数量的样本点。其中,针对荒地和道路的样本点设置为50个,针对耕地为40个,针对沟渠和水道为30个,总计120个样本点。为了更精确地反映种植结构的变化,每年分别设置30个、30个和10个样本点用于玉米、向日葵和其他作物的分类,总计210个样本点。样本点的选择遵循了同质性和代表性原则,并通过GPS技术每月记录一次实地坐标。
#### 3. 研究方法与技术路线
本研究采用了多步骤提取方法,结合GEE平台和多种机器学习技术,实现对种植结构的精准识别。首先,利用高分辨率遥感影像(Tianditu)和视觉判读方法,提取长期稳定且集中分布的土地利用基础要素,如村庄和水域。然后,通过GEE平台获取Sentinel-2卫星数据,计算不同土地利用类型和作物的NDVI值,并利用机器学习模型进行分类,以确定最优的土地利用类型提取模型。最后,基于第二阶段的提取结果,再次应用机器学习技术,对具有耕作属性的土地利用类型进行精细化的种植结构识别。
在遥感数据处理过程中,选择了Sentinel-2卫星的L2A数据,这些数据已经过正射校正、几何校正和大气校正,具有较高的数据质量。数据处理过程中,通过MSK_CLDPRB算法筛选出云量低于30%的图像,并利用SCL波段排除云影和卷云干扰。最终保留的波段包括B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12,这些波段能够有效反映不同地物的光谱特征。
机器学习模型方面,研究选择了三种模型:决策树、随机森林和梯度提升树。其中,梯度提升树模型在总体准确率和Kappa系数方面表现最优,分别比随机森林和决策树提高了1.74%和11.43%,以及2.13%和20.00%。这表明梯度提升树模型在土地利用类型识别和种植结构提取中具有更高的分类精度和数据可靠性。
#### 4. 结果与分析
研究结果显示,不同土地利用类型和作物的NDVI变化趋势存在显著差异。从4月至9月,耕地和沟渠的NDVI曲线呈现出先上升后下降的趋势,而荒地和道路的NDVI曲线则保持相对稳定。耕地的NDVI值在4月至6月期间缓慢上升,6月至7月快速增加,达到峰值后逐渐下降。这种变化趋势主要归因于作物在生长阶段的光合作用增强,导致植被覆盖面积增加,从而提升NDVI值。随着作物逐渐成熟,植被覆盖减少,NDVI值也随之下降。
沟渠的NDVI值在6月至8月期间显著上升,主要由于沟渠内水生植物的生长。这些植物在充足的水和光照条件下迅速扩展,导致NDVI值的增加。相比之下,荒地和道路的NDVI值变化较小,因为这些区域缺乏植被覆盖,且受人为活动影响较小。
在不同作物的NDVI变化分析中,研究发现向日葵的NDVI值在2022年和2023年均在5月达到最低点,分别比4月降低了23.61%和50.64%。这一现象主要与向日葵春季灌溉结束有关,灌溉结束后,土壤水分减少,导致NDVI值下降。然而,在2024年,由于春季灌溉提前,向日葵的NDVI最低值出现在4月。玉米的NDVI曲线在5月至9月期间也呈现出先上升后下降的趋势,其中6月至7月的NDVI值增长较快,8月至9月则迅速下降,这与玉米进入成熟期后植被覆盖减少有关。其他作物的NDVI值在2022年至2024年间表现出持续上升的趋势,其中2024年的NDVI值增长幅度小于前两年,这可能与种植结构的变化有关。
从土地利用类型提取结果来看,研究区域的土地利用类型主要分为荒地和道路、沟渠和水道以及耕地。通过梯度提升树模型提取后,耕地面积占总面积的79.85%,荒地和道路占10.75%,沟渠和水道占4.12%。这些数据表明,耕地是研究区域的主要土地利用类型,而荒地和道路占比较小,但仍然需要重点关注。
在种植结构提取方面,研究发现向日葵的种植面积呈现逐年上升趋势,2024年比2022年增加了27.47%。相比之下,玉米的种植面积逐年下降,2024年比2022年减少了66.18%。其他作物的种植面积也在逐年增加,2024年比2022年增加了60公顷。从空间分布来看,向日葵主要集中在研究区域的中部,并向南扩展,而玉米则主要分布在研究区域的南部,种植面积逐渐减少。
#### 5. 模型评估与优化
在模型构建过程中,研究采用了随机分层抽样方法,选取80%的样本点用于模型训练,其余用于验证。通过调整核心超参数,优化了模型的性能。例如,对于梯度提升树模型,调整了树的数量、收缩率、采样率、最大节点大小和损失函数的选择。最终确定的梯度提升树模型参数为:树的数量为30,收缩率为0.1,采样率为0.5,最大节点大小为10,损失函数为“LeastAbsoluteDeviation”。
模型评估结果显示,梯度提升树模型在总体准确率和Kappa系数方面均优于其他两种模型。例如,2022年梯度提升树模型的总体准确率为0.971,Kappa系数为0.952,而随机森林和决策树模型的总体准确率分别为0.926和0.868,Kappa系数分别为0.881和0.786。2023年梯度提升树模型的总体准确率为0.985,Kappa系数为0.976,而随机森林和决策树模型的总体准确率分别为0.970和0.925,Kappa系数分别为0.951和0.878。2024年梯度提升树模型的总体准确率为0.970,Kappa系数为0.950,而随机森林和决策树模型的总体准确率分别为0.939和0.909,Kappa系数分别为0.900和0.851。
这些结果表明,梯度提升树模型在种植结构提取中具有更高的分类精度和稳定性。然而,研究也指出,梯度提升树模型对沟渠和水道类型的敏感性较低,这可能与沟渠边缘的零散种植以及沟渠与耕地在光谱特性上的相似性有关。因此,未来的研究需要进一步优化模型,提高对这类土地利用类型的识别能力。
#### 6. 讨论与未来展望
NDVI作为遥感技术中的关键指标,广泛应用于植被分类、环境监测和多尺度作物产量估算。NDVI的变化不仅反映了作物的生长阶段和健康状况,还为精准农业提供了重要的数据支持。研究中发现,不同土地利用类型的NDVI变化趋势存在显著差异,这为土地利用分类和种植结构分析提供了理论依据。
在土地利用类型提取方面,本研究采用了多步骤提取方法,首先利用高分辨率影像和视觉判读提取基础要素,再结合机器学习模型进行分类。这种方法提高了分类的准确性和可靠性,同时也为后续的种植结构提取奠定了基础。此外,GEE平台的应用使得遥感数据的处理更加高效,为大规模土地利用分类提供了技术支持。
在种植结构提取方面,本研究通过对比三种机器学习模型,发现梯度提升树模型在总体准确率和Kappa系数方面表现最佳。这表明,梯度提升树模型在处理复杂土地利用类型和作物光谱特征方面具有更强的适应能力。然而,研究也指出,目前仅使用了机器学习模型,尚未引入深度学习方法,这可能限制了模型的深度和泛化能力。未来的研究可以考虑引入深度学习模型,以进一步提升分类精度和模型的适用性。
此外,研究区域的种植结构变化受到多种因素的影响,包括经济收益和种植条件。向日葵因其较高的经济收益和较强的抗旱能力,近年来在研究区域的种植面积逐年增加。而玉米由于对土壤肥力和水分需求较高,且在河套灌区面临严重的土壤盐碱化和水资源短缺问题,其种植面积逐年减少。这些因素共同作用,导致种植结构的变化趋势。
#### 7. 结论
本研究通过多步骤提取方法和机器学习模型的结合,成功实现了对河套灌区左二干渠种植结构的精准提取。研究结果表明,梯度提升树模型在土地利用类型和种植结构分类中表现出更高的准确率和Kappa系数,分别为1.74%和11.43%的提升。此外,向日葵的种植面积呈现逐年上升趋势,而玉米的种植面积则逐年下降。这些结果为河套灌区的农业管理和水资源利用提供了重要的数据支持。
研究还指出,未来的研究可以进一步拓展种植结构分析的尺度,探索不同区域的适用性。同时,引入深度学习模型将有助于提升分类精度和模型的泛化能力,更好地满足不同地区的精准农业管理需求。通过这些方法的不断优化和创新,可以为农业可持续发展提供更加科学的决策依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号