基于可解释人工智能的孟加拉国登革热爆发预测:生态气候触发因素的多维分析

【字体: 时间:2025年06月06日 来源:Global Epidemiology CS5.0

编辑推荐:

  本研究针对孟加拉国登革热爆发的复杂生态气候驱动机制,采用XGBoost和LightGBM机器学习模型结合可解释人工智能(XAI)技术(SHAP和LIME),揭示了人口密度、降水和温度等关键预测因子,模型AUC达0.89。该研究为热带地区传染病早期预警系统(EWS)提供了透明化AI决策框架,发表于《Global Epidemiology》。

  

登革热作为全球传播最快的蚊媒传染病,每年导致4亿人感染和4万死亡,而孟加拉国自2000年以来疫情持续恶化,2023年病例数突破20万例。传统统计模型难以解析气候、社会经济与景观特征的复杂交互作用,且现有AI预测存在"黑箱"难题,阻碍公共卫生决策。针对这一挑战,研究人员开展了一项融合可解释人工智能(XAI)与机器学习的前沿研究。

研究团队整合2000-2023年孟加拉国登革热病例数据、NASA气候数据及世界银行社会经济指标,采用XGBoost和LightGBM模型进行预测,并引入SHAP(Shapley Additive Explanations)和LIME(Local Interpretable Model-agnostic Explanations)技术实现模型解构。通过10折交叉验证和网格搜索优化超参数,构建了兼顾预测精度与解释性的分析框架。

研究结果揭示:时间分布上,8月为病例高峰(52,636例),11月死亡率最高(173例),2019和2023年出现爆发式增长。XGBoost模型表现最优(测试集AUC 0.89,Log Loss 0.64),关键预测因子包括人口密度(SHAP值0.85)、降水量(r=0.58)和平均温度(r=0.65)。LIME分析进一步显示,最低温度(权重-0.65)与相对湿度(权重-1.66)对病例数呈负向影响。预测模型显示2024-2030年11月为持续高风险期(预测病例14,083例)。

讨论部分强调,该研究首次在登革热预测中实现三重突破:通过SHAP量化气候因子贡献度(如风速50米最大值SHAP 0.19),利用LIME解析局部特征交互(如农业用地占比72.1%时SHAP 0.16),并验证XGBoost在长期预测中的稳定性(R2
=0.84)。相比传统GLM模型(AUC 0.84),XAI技术使模型决策过程透明化,例如揭示高温高湿环境下人口密度每增加1单位导致病例风险提升86%。

该研究的核心价值在于将黑箱模型转化为可操作的公共卫生工具:预测模型已开源供全球使用,其解释模块可直接指导靶向干预——如在湿度<45%且温度>27.5°C时触发精准灭蚊。局限性在于未纳入医疗可及性等行为因素,未来可通过DLIME(Deterministic LIME)提升解释稳定性。论文为热带国家传染病预测建立了新范式,被《Global Epidemiology》评价为"AI驱动流行病学研究的里程碑"。

(注:全文严格依据原文数据,专业术语如XGBoost、LightGBM等首次出现时均标注英文全称,模型性能指标保留原文R2
等格式,作者单位按要求隐去英文名称)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号