基于气候变率的塞拉利昂疟疾病例预测研究 ——SARIMA 与人工神经网络模型的比较分析

【字体: 时间:2025年05月21日 来源:Malaria Journal 2.4

编辑推荐:

  疟疾在塞拉利昂仍是重大公共卫生挑战。研究人员对比 SARIMA 与 ANN 模型预测疟疾病例的性能,发现 ANN 模型无需气候变量即可更有效捕捉复杂时间模式,MAPE 低至 6.68%,为疟疾防控提供新方向。

  疟疾,这个由疟原虫通过按蚊叮咬传播的疾病,长期以来如同恶魔般笼罩着热带和亚热带地区,尤其是像塞拉利昂这样的低收入国家。在塞拉利昂,疟疾曾一度处于高流行状态,儿童、孕妇等弱势群体深受其害。尽管有全球倡议和防控措施,但当地卫生基础设施薄弱、环境变化等因素,使得疟疾防控困难重重。气候因素如温度、降水、湿度等对蚊子繁殖和疟原虫发育影响显著,如何利用这些因素准确预测疟疾病例,从而及时制定防控策略,成为亟待解决的问题。
来自非洲多国研究机构的研究人员,聚焦塞拉利昂 2018 至 2023 年的疟疾病例数据,开展了一项具有重要意义的研究。他们旨在比较传统的季节性自回归整合移动平均模型(SARIMA)与人工神经网络(ANN)模型在预测疟疾病例方面的性能,该研究成果发表在《Malaria Journal》上。

研究人员采用了多种关键技术方法。首先收集了塞拉利昂卫生管理信息系统的实验室确诊疟疾病例数据,以及气象机构的气候数据(包括降水、最高温度、平均相对湿度等),并对数据进行了对数变换、归一化等处理,还通过离群值检测和共线性检验等确保数据质量。然后分别构建了基线 SARIMA 模型、加入气候变量的 SARIMAX 模型以及仅基于历史病例数据的 ANN 模型,通过多种评价指标(如均方根误差 RMSE、平均绝对误差 MAE、平均绝对百分比误差 MAPE、决定系数 R2)来评估模型性能。

数据特征与模型构建


通过分析发现,疟疾病例呈现明显的周期性,在雨季(如 6 月、7 月)达到高峰,与降水、湿度等气候变量存在显著相关性。降水与疟疾病例呈强正相关(r=0.68),平均相对湿度呈中等正相关(r=0.55),最高温度呈中等负相关(r=-0.45)。研究人员对数据进行对数变换以稳定方差,采用 K-means 聚类等方法检测离群值,并通过方差膨胀因子(VIF)检验排除共线性变量,为模型构建奠定了坚实基础。

模型性能对比


在模型性能方面,基线 SARIMA 模型的 MAPE 为 12.01%,加入气候变量后提升至 11.45%,R2 从 0.59 提高到 0.65。然而,ANN 模型表现更为出色,其 MAPE 低至 6.68%,R2 高达 0.92,无需明确的气候输入即可有效捕捉非线性动态,在各项指标上均优于 SARIMA 和 SARIMAX 模型。

残差分析与模型有效性


对模型残差的分析显示,SARIMA、SARIMAX 和 ANN 模型的残差均接近正态分布,表明模型假设得到满足,预测结果具有可靠性。

这项研究得出了重要结论:人工神经网络模型在预测塞拉利昂疟疾病例方面优于传统的 SARIMA 模型,展现出捕捉复杂时间模式和非线性关系的强大能力,即便不加入气候变量也能实现高精度预测。这一结果凸显了机器学习方法在疟疾防控中的价值,为公共卫生决策提供了新的有力工具。在讨论中,研究人员指出,尽管 SARIMA 模型能捕捉季节性模式,但在处理复杂动态方面存在局限,而 ANN 模型为高负担地区的疟疾预测提供了新方向。未来研究可进一步探索将气候变量纳入 ANN 模型,以提升预测精度,同时需关注数据质量和空间异质性等问题。该研究为塞拉利昂乃至其他疟疾高流行地区制定及时、有针对性的防控措施提供了科学依据,有望助力全球疟疾消除目标的实现。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号