编辑推荐:
在发展中国家,突发气候灾害(如洪水、滑坡)给灾害风险管理带来挑战。秘鲁因地理经济多样性及城市易受灾性被选为案例。研究人员采用监督学习方法,用 XGBoost 算法训练二元分类器预测家庭脆弱性,模型在测试数据中表现良好,为灾害准备和响应提供数据驱动方法。
气候变化加剧了全球自然灾害的频发,尤其像洪水、滑坡这类突发气候相关灾害,正给发展中国家的灾害风险管理带来严峻挑战。以秘鲁为例,其地理和经济的多样性,以及众多城市面临的自然灾害威胁,使得灾后救援需求的精准识别成为难题。传统的灾害风险评估方法在资源有限的情况下,难以动态、全面地捕捉家庭脆弱性的多维特征,容易导致救援需求估算偏差,进而引发资源错配等问题。因此,如何利用数据驱动的方法,更精准地预测家庭受灾脆弱性、识别救援最终需求点,成为提升灾害准备和响应效率的关键。
为解决这一问题,研究人员开展了相关研究。他们以秘鲁为研究对象,基于家庭的社会经济、地理、健康和社会特征,利用监督学习方法训练二元分类器,以预测家庭在洪水和滑坡灾害中的脆弱性。研究得出,所构建的分类器在滞后一年的测试数据中表现出良好的准确性,为灾害应对提供了有效的预测工具。该研究成果发表在《International Journal of Disaster Risk Reduction》,为灾害风险领域提供了新的思路和方法。
研究中主要采用的关键技术方法包括:运用 XGBoost 这一梯度提升算法训练二元分类器,为优先减少假阴性(未满足需求的风险),设计了自定义目标函数;借助部分依赖图(Partial Dependence Plots)和 SHAP 值(SHapley Additive exPlanations)对模型进行解释,以明确影响家庭脆弱性的潜在因素。数据来源于秘鲁国家家庭调查(ENAHO),该调查数据经国家统计和信息研究所(INEI)处理,采用 “热平台”(Hot Deck)方法插补缺失值。
描述性分析
研究对样本中的家庭特征进行了分析,共有 112 个特征纳入机器学习流程。其中,受洪水和滑坡影响的家庭分别占样本的 1.20% 和 5.45%,研究仅对受影响家庭的描述性统计进行了报告,分析其在社会经济、地理等方面的特征差异。
模型构建与性能评估
通过 XGBoost 算法训练的二元分类器,以家庭是否报告受灾害影响为标签,在滞后一年的测试数据中取得了有前景的准确性,表明模型能够基于家庭可观测特征有效预测其脆弱性,为灾害前的需求预估提供了可能。
模型解释性分析
利用部分依赖图和 SHAP 值对模型预测进行解释,明确了各特征对家庭脆弱性的影响方向和程度。例如,某些社会经济特征(如收入水平、住房条件)和地理特征(如所处区域的地形地貌)对脆弱性预测具有显著影响,这些结果为决策者理解家庭脆弱性的驱动因素提供了依据。
研究结论表明,基于监督学习的方法能够有效预测家庭在洪水和滑坡中的脆弱性,所构建的分类器在灾害需求估计中具有较高的实用性和准确性。通过自定义目标函数优先减少假阴性,可降低关键案例中需求未满足的风险,这对于资源有限的发展中国家尤为重要。模型的解释性分析进一步揭示了家庭脆弱性的影响因素,有助于决策者制定针对性的灾害风险降低策略,如优先加强高脆弱性区域的基础设施建设、完善灾害预警系统等。该研究为应对反复发生的气候相关灾害提供了数据驱动的需求估计和脆弱性评估方法,对提升灾害准备和响应的效率、减少灾害损失具有重要的理论和实践意义,也为后续相关研究提供了可借鉴的方法和思路。