基于树集成算法的热带小岛屿发展中国家建筑洪水损害评估研究——以萨摩亚热带气旋埃文事件为例

【字体: 时间:2025年09月14日 来源:Water Resources Research 5

编辑推荐:

  本文系统评估了树集成算法(如XGBoost、随机森林等)在热带小岛屿发展中国家(SIDS)建筑洪水损害预测中的性能。研究基于2012年热带气旋埃文在萨摩亚的实地损害数据,揭示了多变量模型(Multivariable Ensemble Models)相比单变量模型(Univariable Models)在预测精度(MAE、SMAPE)和可靠性(QR、HR)方面的显著优势,并首次发现建筑几何特征(如面积ba)对损害预测的重要贡献。该研究为SIDS地区洪水风险管理提供了数据驱动的模型构建范式,对改善全球洪水损害模型的地理代表性具有重要科学价值。

  

3.1 损害数据描述

研究团队在热带气旋埃文过后8周(2013年11月)对萨摩亚Vaisigano河流域143栋建筑进行了系统性的实地损害评估。数据采集采用RiACT数字调查应用,记录了六类灾害强度变量和八类建筑特征变量(详见表1)。水深测量显示地面以上水深(wdg)范围0.3-2.7米,地板以上水深(wdf)范围-0.4-2.4米(负值表示地板高于地面)。通过建筑前后水位差计算的流速(fv)达4.2m/s,23处建筑出现基础冲刷现象,62处存在碎屑冲击痕迹。

建筑特征方面,67%为住宅或 communal用途(如Faleo'o传统建筑),58%采用非工程轻型木结构框架(bsf),37%为轻质钢筋混凝土砌块结构。72%住宅采用 perimeter wall with earthfill 基础,平均地板高度(bfh)0.46米。92%建筑为单层(bs)且面积(ba)小于200m2。Spearman相关性分析表明:水流速度(fv)与损害比率(DRb)相关性最强(rho=0.51),建筑面积(ba)呈负相关(rho=-0.26),而结构类型(bsf)相关性不显著。这揭示出在小岛屿国家的陡峭流域环境中,水动力因素比建筑结构特性对损害的影响更为显著。

3.2 模型评估

研究对比了四种树基算法:决策树(DT)、随机森林(RF)、极端随机树(XT)和极限梯度提升(XGB)在单变量(仅wdg)和多变量(全部14个变量)配置下的性能。通过网格搜索确定了最优超参数组合(见表3),采用10折交叉验证进行模型验证。

多变量集成模型全面优于单变量模型,其中XGBM模型表现最佳(MAE=0.17, SMAPE=43.8%)。与单变量最优模型XTU相比,多变量模型的平均绝对误差降低19%,对称平均绝对百分比误差改善6%。值得注意的是,所有模型均呈现轻微的低估倾向(MBE为负值),这与数据集中高损害样本(DRb>0.8)占比18%有关。可靠性指标显示,XGBM的90分位距(QR)为0.35,命中率(HR)达0.4,表明其预测结果具有较好的稳定性。

3.3 模型变量评估

通过均值下降精度法评估变量重要性发现:地板以上水深(wdf)和建筑面积(ba)是影响预测精度的最关键变量(图6)。系统性变量添加实验表明:当变量数量增至5个时模型精度达到峰值,继续添加变量反而导致性能下降。具体而言,添加wdf使MAE降低5.4%,继续添加ba后累计改善达10%。建筑几何特征(ba)的加入使预测偏差(MBE)减少87.4%。

值得注意的是,传统洪水损害模型中常用的结构类型(bsf)和层数(bs)变量在本研究中重要性排名靠后,其添加甚至导致模型过拟合和精度下降。这与当地建筑类型的同质性(92%为单层轻型结构)密切相关。研究还发现流速(fv)和遮蔽效应(shd)变量虽对精度改善有限,但能有效提升模型可靠性(降低QR,提高HR)。

研究的局限性包括:数据仅来源于单一流域的河流型洪水事件,缺乏其他洪水类型(如内涝、堤坝溃决)的样本;住宅类建筑样本主导(67%)可能影响模型向非住宅建筑的迁移性能;高损害样本不足导致系统性的低估倾向。这些局限也指明了未来研究需要重点突破的方向:通过跨区域、多灾种的协同调查增强数据异质性,特别是对商业和工业建筑的针对性评估。

4 结论

本研究证实了多变量树集成算法在小岛屿发展中国家建筑洪水损害预测中的优越性。研究首次系统性地揭示出建筑几何特征(特别是面积ba)对损害预测的重要贡献,这一发现对改善模型的地理迁移能力具有重要价值。基于 volunteered geographical information(VGI)和全球建筑测绘计划(如OpenStreetMap、Microsoft建筑足迹)日益丰富的几何数据,为低成本获取关键预测变量提供了新途径。

研究强调模型开发需遵循"精度-资源"平衡原则:建议优先采集水动力参数(wdf、fv)和建筑几何数据(ba),而可酌情简化结构性变量(bsf、bs)的采集。这种数据采集策略既符合SIDS国家的资源约束现实,又能保证模型预测性能。未来研究应重点探索几何变量在不同地理环境下的普适性规律,并结合当地建筑损害机理知识和构件重置成本数据,构建更符合SIDS特点的洪水脆弱性模型体系。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号