基于小波变换与机器学习融合的农业干旱遥感预测框架——以巴基斯坦信德省为例
《Agricultural Water Management》:Agricultural drought forecasting using remote sensing: A hybrid modeling framework by integrating wavelet transformation and machine learning techniques
【字体:
大
中
小
】
时间:2025年10月28日
来源:Agricultural Water Management 6.5
编辑推荐:
本研究针对气候变化加剧下农业干旱预测精度不足的挑战,创新性地将小波变换预处理与集成机器学习模型(XGBoost、AdaBoost、Random Forest)相结合,构建了一种混合建模框架。利用CHIRPS降水数据和MODIS衍生的环境指标(LST、NDVI、MNDWI、VCI、VHI),对巴基斯坦信德省进行案例研究。结果表明,小波预处理显著提升了预测精度,其中XGBoost模型表现最佳(R2 = 0.964)。该框架为识别干旱易发区、增强农业韧性及制定气候风险应对政策提供了可靠的决策支持工具。
气候变化正以前所未有的速度和强度影响着全球环境,其中干旱作为一种复杂的自然灾害,其频率和严重性日益加剧,对农业生产力构成严重威胁,并给水资源带来额外压力。准确预测干旱对于资源管理和减灾至关重要,但由于气候和生态过程具有复杂且非平稳的特性,这仍然是一项艰巨的挑战。传统的监测方法往往难以捕捉干旱的动态演变过程,尤其是在数据稀缺或地形复杂的地区。因此,开发高效、准确的干旱预测模型,对于保障粮食安全、指导农业生产和水资源管理具有紧迫的现实意义。在此背景下,遥感技术凭借其大范围、周期性观测的优势,为干旱监测提供了新的视角。然而,如何从海量的遥感数据中提取有效信息,并构建高精度的预测模型,是当前研究的重点和难点。发表在《Agricultural Water Management》上的这项研究,旨在通过一种创新的混合建模框架,提升农业干旱的预测能力。
为了应对上述挑战,研究人员开展了一项针对巴基斯坦信德省农业干旱的预测研究。本研究的核心方法是集成小波变换(Wavelet Transform)和多种机器学习(Machine Learning, ML)技术。具体而言,研究人员首先利用离散小波变换(Discrete Wavelet Transform, DWT)对从2001年至2023年的长时间序列遥感数据进行预处理,这些数据包括来自MODIS卫星的陆地表面温度(Land Surface Temperature, LST)、归一化植被指数(Normalized Difference Vegetation Index, NDVI)、改进的归一化差异水体指数(Modified Normalized Difference Water Index, MNDWI)、植被状况指数(Vegetation Condition Index, VCI)、温度状况指数(Temperature Condition Index, TCI)以及植被健康指数(Vegetation Health Index, VHI),同时结合了CHIRPS(Climate Hazards Group InfraRed Precipitation with Station data)降水数据。小波变换的目的是将非平稳的时间序列数据分解为不同频率的子序列(近似分量和细节分量),以捕捉多尺度模式并降低噪声。随后,将分解后的信号作为特征输入到三种集成机器学习模型中进行训练和预测,这三种模型分别是极端梯度提升(eXtreme Gradient Boosting, XGBoost)、自适应提升(Adaptive Boosting, AdaBoost)和随机森林(Random Forest, RF)。研究采用植被健康指数(VHI)作为表征农业干旱的目标变量。整个数据处理和部分指标提取在谷歌地球引擎(Google Earth Engine, GEE)云平台上完成,而模型训练和评估则在外部计算环境中进行。数据集按照70%训练和30%测试的比例进行划分,并使用决定系数(R2)、均方根误差(Root Mean Squared Error, RMSE)和平均绝对误差(Mean Absolute Error, MAE)等指标来评估模型的性能。
研究人员首先对TCI、VCI、VHI、LST、NDVI、MNDWI和降水这七个关键干旱相关变量进行了离散小波变换分解。采用“Haar”小波基函数进行三级分解,将每个变量的原始时间序列分解为一个代表长期趋势的近似分量和三个代表不同尺度高频波动的细节分量。分解结果显示,DWT能够有效地分离出信号中的趋势信息和细节波动。通过对分解后的信号进行重构,并计算重构信号与原始信号之间的RMSE和R2,验证了DWT分解和重构的准确性。所有变量的重构R2值介于0.77至0.92之间,RMSE值较低(例如NDVI的RMSE为0.04),表明DWT能够高保真地表示这些干旱指标的时间序列特征,为后续的机器学习建模提供了高质量的输入特征。
对各个干旱变量进行的相关性分析揭示了它们之间复杂的相互作用。分析发现,LST与TCI之间存在极强的负相关性(r = -0.96),表明地表温度升高会加剧植被的温度胁迫。LST与VHI也呈现强负相关(r = -0.90),进一步证实高温对植被健康的负面影响。TCI与VHI则表现出强正相关(r = 0.92),说明温度条件是影响植被整体健康的关键因素。VCI与NDVI之间存在强正相关(r = 0.93),这符合预期,因为NDVI是计算VCI的基础。VCI与VHI也显著正相关(r = 0.75)。降水与MNDWI呈强正相关(r = 0.74),表明降雨量增加有助于提高地表水体指数。然而,降水与NDVI(r = 0.28)和VCI(r = 0.11)的相关性较弱,这可能与研究区半干旱气候、灌溉影响以及植被对降雨响应的滞后性有关。该分析为理解不同指标在干旱预测中的相对重要性提供了依据。
本研究对比评估了XGBoost、随机森林(RF)和AdaBoost三种集成机器学习模型在预测VHI方面的表现。总体而言,经过小波预处理后,所有模型都表现出较高的预测精度。XGBoost模型取得了最佳性能,其测试集的R2达到0.964,RMSE为0.021,MAE为0.023。AdaBoost模型次之,R2为0.946,RMSE为0.030。随机森林模型的性能稍逊,R2为0.926,RMSE为0.035。模型在训练集和测试集上的预测值与实际值对比图显示,XGBoost模型能够很好地捕捉VHI的动态变化趋势,且在新数据上的泛化能力最强。
XGBoost模型在训练和测试阶段均表现出色,预测曲线与真实VHI值高度吻合。特征重要性分析表明,在预测VHI时,NDVI是贡献最大的特征,其次是LST、TCI和VCI。这凸显了植被绿度和温度状况在评估农业干旱中的核心作用。
随机森林模型同样展现了良好的预测能力,但在测试阶段观察到比XGBoost稍大的偏差。其特征重要性排序与XGBoost模型类似,NDVI仍然是最重要的预测因子。
AdaBoost模型的预测性能介于XGBoost和随机森林之间。在测试阶段,其预测值出现了一些波动,表明其泛化能力略低于XGBoost。特征重要性结果再次确认了NDVI和温度相关指标的主导地位。
为了更直观地比较三个模型的性能,研究使用了泰勒图(Taylor Diagram)。泰勒图同时显示了模型预测值与观测值之间的相关系数、标准差以及中心均方根误差。分析结果显示,在训练阶段,所有模型都与观测值高度一致(相关系数接近0.96,标准差接近观测值的标准差0.15)。在测试阶段,所有模型的性能均有轻微下降,但XGBoost模型仍然最接近代表完美预测的参考点,表明其具有最佳的准确性和稳健性。随机森林和AdaBoost模型在测试集上的表现相对分散,说明其泛化能力不如XGBoost。泰勒图清晰地证实了XGBoost在捕获VHI时空变异方面优于其他两种模型。
本研究通过集成小波变换和先进的集成机器学习模型,成功构建了一个高精度的农业干旱预测框架。研究结论明确指出,小波变换作为一种有效的数据预处理技术,能够显著提升机器学习模型处理非平稳时间序列数据的能力,从而改善干旱预测的准确性。在三种集成模型中,XGBoost凭借其梯度提升机制和内置正则化功能,表现出最优异的预测性能和泛化能力,被证明是进行此类遥感干旱预测的最有效工具。相关性分析和特征重要性结果共同表明,植被指数(特别是NDVI)和地表温度(LST)是驱动VHI变化、亦即反映农业干旱状况的最关键指标。
该研究的成功具有多重重要意义。首先,它为解决复杂环境下的农业干旱预测问题提供了一种新颖且强大的方法论框架。其次,该框架具有可转移性,经过适当的校准,可以应用于世界其他具有不同气候特征的农业区,为全球范围的干旱监测和早期预警提供了技术潜力。再者,研究所展示的将云计算平台(GEE)与本地高级建模相结合的工作流程,为处理大规模遥感数据和进行复杂计算分析提供了可行方案。最后,研究成果对政策制定者和农业从业者具有直接的实用价值:通过提供更准确的干旱预报,可以帮助农民和相关部门提前采取应对措施,如优化灌溉、调整种植结构等,从而增强农业系统对气候变化的韧性,保障粮食安全,减轻干旱可能带来的社会经济损失。
当然,研究也存在一些局限性,例如依赖中等空间分辨率的卫星数据,未来可融入更高分辨率数据(如Landsat、Sentinel)以提升局部精度;模型仅在信德省进行训练和测试,其普适性需在不同地理气候区进一步验证;目标变量VHI主要反映植被响应,未来可考虑融合气象干旱指数(如SPI、SPEI)和土壤湿度等更多指标,以构建更全面的多尺度干旱预测系统。尽管存在这些可进一步探索的空间,本研究无疑为利用数据驱动方法应对气候变化下的农业水资源管理挑战树立了一个重要的里程碑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号