利用Sentinel-2合成影像和数据平衡方法降低农田土壤有机碳及黏土含量预测中的偏差
《Remote Sensing of Environment》:Reducing bias in cropland soil organic carbon and clay predictions using Sentinel-2 composites and data balancing
【字体:
大
中
小
】
时间:2025年11月07日
来源:Remote Sensing of Environment 11.4
编辑推荐:
精准土壤有机碳(SOCS)和黏土含量分布对气候智能型农业至关重要。本研究基于德国农业土壤调查(BZE-LW)数据集,通过优化Sentinel-2土壤反射率复合体(SRC)参数和引入多源遥感特征(如光谱时序指标STM、数字高程模型DEM),构建了空间数据增强与多数类 undersampling结合的平衡框架。实验表明,采用PV+IR2<0.24和NBR2<0.16的SRC4模型,结合30% SOCS和60%黏土数据平衡,使预测水平误差(RMSE)降低19%,相关系数(CCC)分别达到0.82(SOCS)和0.90(黏土),且显著改善预测值的分布范围与实测数据的一致性。研究揭示了NDVI和NBR2阈值设置对高值样本的排除效应,提出需同时评估模型输出的分布特性与空间异质性。
本文探讨了通过多光谱裸土观测生成的土壤反射率复合体(SRC)在高分辨率土壤图绘制中的应用,并针对SRC生成过程中因掩膜和排除土壤样本而导致的偏差以及土壤属性分布的准确表示这两个关键问题进行了分析。研究结果表明,常用的索引如归一化烧伤比(NBR2)和归一化植被指数(NDVI)分别与土壤有机碳储量(SOCS)和黏土含量显著相关。这种相关性可能导致在生成SRC时系统性地排除高SOCS和高黏土含量的样本,从而引入偏差。此外,仅使用SRC波段训练的模型未能捕捉到训练数据的完整范围,限制了土壤属性图的适用性。虽然引入额外的遥感特征(如光谱-时间指标和索引)显著提高了预测准确性,但对不平衡样本的表示仍然具有挑战性。研究还展示了一个结合空间数据增强和多数下采样的框架,能够有效提升预测范围和一致性相关系数(CCC),其中SOCS的CCC达到0.82,黏土的CCC达到0.9。
### 土壤有机碳储量与黏土含量的重要性
土壤有机碳储量是农业土壤的重要组成部分,它不仅关系到土壤的碳储存能力,也影响着土壤的肥力和环境功能。土壤中的有机碳含量对气候调节和土壤健康至关重要,因此,精确的土壤有机碳储量图是实现气候智能农业的基础。与此同时,黏土含量作为土壤结构的重要参数,对土壤碳的保留和稳定具有重要作用。黏土矿物因其高吸附能力和形成稳定土壤团聚体的能力,成为土壤碳存储的重要影响因素。然而,传统的土壤采样方法虽然能够提供详细的土壤数据,但往往受到时间和样本数量的限制,难以满足高分辨率土壤图的需求。
### 土壤反射率复合体的应用
土壤反射率复合体(SRC)是一种通过多光谱裸土观测生成的可扩展方法,用于高分辨率土壤图的绘制。SRC能够通过提取光谱特征来直接分析土壤属性,如有机碳储量和黏土含量。然而,当前的研究多集中于最大化模型性能,而忽视了在生成SRC过程中可能引入的偏差。例如,低阈值的NDVI和NBR2可能会排除高有机碳储量和高黏土含量的样本,从而影响最终土壤图的准确性。此外,土壤属性的分布往往具有偏态,而模型在训练过程中可能无法准确再现这些分布,导致预测范围的局限。
### 土壤反射率复合体的参数选择
为了评估不同SRC参数对模型性能的影响,研究中测试了多种组合,包括低NBR2和NDVI阈值的组合(SRC1和SRC2)以及低NBR2阈值的组合(SRC3)。结果显示,这些参数选择虽然在某些情况下提高了模型的准确性,但也可能导致样本的系统性排除。例如,使用低NBR2阈值的SRC1和SRC3排除了大量高黏土含量的样本,这不仅影响了模型的预测范围,还可能引入偏差。相比之下,基于PV+IR2和NBR2的组合(SRC4)在预测精度和样本分布的保持方面表现更优,显示出更小的偏差。
### 数据平衡对模型性能的影响
研究还探讨了数据平衡方法对模型性能的影响。通过结合少数过采样和多数下采样,研究团队开发了一个新的框架,以改善模型对极端值的预测能力。结果显示,数据平衡方法显著提高了预测范围和一致性相关系数(CCC),特别是在高有机碳储量和高黏土含量的预测中。例如,通过优化数据平衡,SOCS的CCC从0.78提升至0.82,而黏土的CCC从0.88提升至0.9。然而,这种改进也依赖于训练数据的初始分布,因此需要找到样本数量与数据平衡之间的最佳权衡。
### 未来研究方向与建议
研究强调了在生成SRC土壤图时,考虑被排除样本的重要性,以识别潜在的模型偏差。此外,建议通过比较预测值和土壤样本的范围与分布来提高最终土壤图的适用性和可靠性。未来的研究应关注如何优化SRC参数以减少样本的系统性排除,并探索更多遥感特征的引入,以提高模型对土壤属性的预测能力。同时,针对土壤属性的分布特点,应采用不同的数据平衡策略,以确保模型能够准确再现土壤的全范围和分布。
### 总结
本文的研究为高分辨率土壤图的生成提供了新的思路,强调了在使用SRC进行土壤属性预测时,需综合考虑样本选择和数据平衡策略。通过分析不同参数组合对模型性能的影响,研究揭示了裸土指数与土壤属性之间的相互作用,并提出了有效的解决方案,以提高预测的准确性和可靠性。研究结果对于实现气候智能农业、提高土壤管理效率以及保护土壤资源具有重要意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号