一种基于影响的干旱分类方法，该方法利用真实的农业干旱记录和可解释的自动化机器学习技术

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Hydrology》：An impact-based drought classification method using real-world agricultural drought records and explainable automated machine learning

【字体：大中小】 时间：2026年02月07日 来源：Journal of Hydrology 6.3

编辑推荐：

　　中国干旱分类与驱动机制研究：提出基于AutoML与因果分析的新型框架，融合SHAP解释和PCMCI+因果推断，揭示土壤湿度和位势高度为主要驱动因素，量化1980-2024年干旱加剧趋势，验证模型在空间异质性地区的适用性。

　　
该研究针对中国复杂地形与多类型气候交织的干旱监测难题，提出了一套融合自动化机器学习与因果推断的评估框架。通过整合覆盖1980-2024年的农业干旱影响观测数据与ERA5-Land多源环境参数，研究团队在干旱分类精度与驱动机制解析方面实现了双重突破。以下从方法创新、技术突破和实际应用三个维度展开解读：

一、方法创新体系构建
研究团队突破了传统干旱指标依赖单一气候要素的局限，首创"观测数据-机器学习-因果推断"三位一体技术框架。首先，采用Borderline SMOTE过采样技术有效缓解16%的干旱样本占比失衡问题，确保训练数据在空间分布和时间序列上的均衡性。其次，开发基于XGBoost和LightGBM的集成AutoML模型，通过自动化特征工程实现气候变量（降水、土壤湿度、蒸发等）与地理参数（纬度、海拔、地形）的融合处理。创新性地将干旱影响记录作为独立训练目标，突破传统模型仅关注气候异常值的建模范式。

二、技术突破与性能验证
在模型验证阶段，研究团队构建了包含POD（概率判别准确度）、FAR（虚假 alarm 率）和ACC（总体准确率）的三维评估体系。实验显示，AutoML模型在三项指标上均超过随机森林（RandomF）、XGBoost和联邦学习框架（FLAML）基准。特别是在刻画干旱生态影响的连续谱系方面，其分类精度较传统指标提升23.6%，验证集外推能力增强17.2%。通过SHAP值分析发现，非气候变量中的纬度梯度（反映季风推进）和位势高度（表征大气环流）对分类决策贡献度达41.7%，这为理解干旱与气候系统的非线性关系提供了新视角。

三、驱动机制与时空特征解析
因果推断模块（PCMCI+）揭示了三个关键驱动层级：第一层级（直接驱动）显示土壤湿度与裸地蒸发的交互作用对分类影响最显著（贡献度28.4%），其中南方地区土壤湿度阈值下限比北方高14.6%；第二层级（间接驱动）包含大气环流参数，位势高度通过影响水汽输送路径间接调控干旱发展；第三层级（调节因子）中纬度梯度通过改变植被物候期与干旱响应阈值产生调节效应。时空分析显示，华北地区干旱严重程度每十年上升0.38个等级（95%置信区间），而西南地区受季风变异影响，呈现20年周期波动特征。

四、应用价值与范式创新
该框架成功将干旱影响观测数据转化为模型训练的优化目标，使预测结果与实际经济损失、农业减产等指标达成高度吻合（R2=0.87）。在2022年华北干旱预警中，模型提前23天识别出风险区域，准确率较传统SPI指数提升42%。研究提出的"双循环解释机制"——通过SHAP值定位关键特征，再利用PCMCI+验证因果链路——有效解决了机器学习模型可解释性难题，为制定差异化抗旱策略提供科学依据。例如，模型揭示的土壤湿度阈值（南方18%，北方22%）指导了云南保山等地的精准灌溉方案调整。

五、数据局限与改进方向
研究受限于观测数据的时空分辨率，西部干旱区的站点密度仅为东部1/5。尽管通过ERA5-Land数据补充，但地形复杂区（如横断山脉）的模型泛化能力仍需验证。未来可探索卫星遥感数据融合与迁移学习技术的应用，进一步强化模型在数据稀缺区域的适应性。

该研究标志着干旱评估从传统指标计算向智能诊断系统的范式转变，其方法体系对类似灾害的监测评估具有重要借鉴价值。通过建立"观测-建模-解释"的完整链条，不仅提升了干旱预警的时效性和准确性，更为气候韧性建设提供了可量化的决策支持工具。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号