利用基于混合小波的深度学习模型,结合气候驱动的多变量时间序列数据,对苏丹地区的内脏利什曼病进行预测
《Acta Tropica》:Forecasting visceral leishmaniasis in Sudan using hybrid wavelet based deep learning models on climate driven multivariate time series
【字体:
大
中
小
】
时间:2025年11月20日
来源:Acta Tropica 2.5
编辑推荐:
针对苏丹东部Gedaref州 visceral leishmaniasis(VL)发病率受复杂气候因素影响且难以预测的问题,本研究提出了一种结合小波变换与深度学习的混合模型(Wavelet-GPR、Wavelet-StemGNN、Wavelet-TCN–BiLSTM),并对比了传统VAR模型。结果表明,Wavelet-GPR模型在RMSE(43.93)、MAE(32.85)、R2(0.93)和MAPE(14.6%)等指标上最优,且能提供可靠的预测区间,为资源有限地区疾病监测和预警提供新方法。
本文探讨了如何利用气候数据来预测东部苏丹地区 Gedaref 州的 visceral leishmaniasis(VL)月度发病率。作为一种由寄生虫 *Leishmania donovani* 引起并通过沙蝇传播的疾病,VL 在全球范围内被视为一种被忽视的热带病(NTD),尤其是在南亚、东非和南美洲等地区。该研究的目标是通过结合先进的机器学习技术与传统的统计方法,建立一个更加精确且适用于资源有限环境的预测模型。
研究者提出了一种新的混合模型,该模型融合了小波变换(wavelet transform)和深度学习技术,以捕捉疾病传播过程中的多尺度模式和线性与非线性关系。小波变换是一种强大的信号处理工具,能够将复杂的时间序列数据分解为不同时间尺度的成分,从而更清晰地识别出季节性变化、趋势和周期性特征。在该研究中,小波变换被用于预处理气候数据,如降雨量、温度和湿度,这些因素在 VL 的传播中起着至关重要的作用。通过这种方式,模型可以更有效地从噪声中提取出关键的气候信号,提高预测的准确性。
为了验证模型的有效性,研究者构建了三种混合模型:Wavelet-Gaussian Process Regression(Wavelet-GPR)、Wavelet–Spatiotemporal Graph Neural Network(Wavelet–StemGNN)和 Wavelet–Temporal Convolutional Network with Bidirectional LSTM(Wavelet–TCN–BiLSTM)。这些模型分别结合了不同的深度学习架构,旨在从不同角度捕捉疾病与气候之间的复杂关系。其中,Wavelet-GPR 模型在预测精度方面表现最佳,其均方根误差(RMSE)为 43.93,平均绝对误差(MAE)为 32.85,决定系数(R2)达到 0.93,平均绝对百分比误差(MAPE)为 14.6%。这些指标表明,Wavelet-GPR 在捕捉疾病传播模式和提供准确的预测区间方面具有显著优势。
相比之下,传统的向量自回归模型(VAR)作为基准模型,在预测精度上表现不佳。VAR 模型主要用于分析多个时间序列变量之间的线性关系,但在处理非线性动态和多尺度模式时存在局限。研究者指出,尽管 VAR 模型能够提供一定的预测能力,但其在捕捉 VL 发病高峰期的动态变化时表现较差,例如其平均绝对误差(MAE)为 51.11,平均绝对百分比误差(MAPE)高达 197.2%。这说明,传统线性模型在处理复杂疾病传播模式时可能无法充分反映实际的动态变化。
Wavelet–StemGNN 模型利用了图神经网络(Graph Neural Network, GNN)技术,通过学习不同气候变量和疾病数据之间的动态依赖关系,进一步提升了预测的准确性。该模型特别适用于具有空间和时间异质性的数据,能够有效捕捉不同区域之间的相互影响。Wavelet–TCN–BiLSTM 模型则结合了时间卷积网络(TCN)和双向长短期记忆网络(BiLSTM),旨在通过捕捉长期依赖关系和季节性变化,提高对 VL 发病模式的预测能力。这些模型在结构上都依赖于小波变换对输入数据的分解,以减少噪声并突出关键的气候信号。
研究者还指出,现有的一些预测方法在 VL 的建模和预测方面存在一定的局限性。例如,一些研究依赖于单变量时间序列模型,如 SARIMA 和 LSTM,这些模型虽然在某些情况下表现良好,但往往忽略了气候变量之间的多变量交互作用。此外,许多模型需要大量的高分辨率数据,而在资源有限的地区,这些数据可能难以获取或存在不完整性。还有一些模型受限于数据质量,难以准确反映疾病在不同流行区域之间的传播模式。
为了克服这些挑战,本文提出了一种多变量时间序列建模框架,将 VL 发病数据与气象数据相结合,构建了一个更加全面的预测模型。这一框架不仅考虑了气候变量之间的相互作用,还引入了深度学习技术,以捕捉更复杂的非线性关系。通过这种方式,研究者希望能够提高 VL 的预测能力,并为疾病监测和预警系统提供更可靠的工具。
在模型的评估过程中,研究者采用了多种预测指标,包括 RMSE、MAE、R2 和 MAPE,以全面衡量模型的预测性能。结果显示,Wavelet-GPR 模型在这些指标上均优于其他模型,表明其在处理复杂气候-疾病关系时具有更强的适应性和准确性。此外,Wavelet-GPR 还能够提供更加校准的预测区间,这在疾病的早期预警中尤为重要。通过这些预测区间,公共卫生部门可以更好地评估疾病爆发的可能性,并提前采取相应的防控措施。
本文的研究成果不仅适用于 Gedaref 州,还可以推广到其他资源有限的 VL 流行地区。例如,在苏丹的其他地区以及东非其他国家,由于气候和环境条件的相似性,该模型的预测能力可能同样有效。此外,该模型还可以作为其他类似疾病(如疟疾、登革热等)预测研究的参考,尤其是在气候敏感型疾病的建模方面。
研究者还强调了未来工作的方向。首先,他们计划引入更多层次的环境和社会经济数据,以进一步提高预测的准确性和实用性。例如,人口流动、土地利用变化、卫生基础设施状况等因素都可能对 VL 的传播产生影响。通过整合这些数据,模型可以更全面地反映疾病传播的复杂性,从而为公共卫生政策的制定提供更科学的依据。其次,研究者希望进一步优化模型的结构和参数,以适应不同地区的气候和流行模式。这包括对小波变换的参数进行调整,以及对深度学习模型的层数和结构进行优化,以提高模型的泛化能力。
此外,本文的研究还具有重要的实践意义。在资源有限的地区,建立一个可靠的疾病预测系统对于公共卫生管理至关重要。传统的预测方法往往需要大量的数据和复杂的计算资源,而本文提出的混合模型则能够在数据稀缺的情况下提供有效的预测。通过结合小波变换和深度学习技术,该模型能够在较少的数据基础上捕捉到关键的气候信号,从而提高预测的可靠性。这使得该模型特别适用于那些缺乏高分辨率气象数据的地区,为这些地区的疾病监测和预警系统提供了新的思路。
在实际应用中,该模型可以用于制定月度疾病预警报告,并指导诊断工具和药品的提前储备。例如,在预测到某个月份 VL 发病率可能上升时,公共卫生部门可以提前调配资源,确保在疾病高发期有足够的诊断能力和治疗手段。这种提前干预不仅可以降低疾病的传播风险,还可以减少对医疗资源的过度依赖,提高公共卫生系统的应对能力。
最后,本文的研究成果展示了机器学习技术在疾病预测中的巨大潜力。通过将小波变换与深度学习模型相结合,研究者成功构建了一个能够捕捉多尺度气候-疾病关系的预测框架。这一框架不仅提高了 VL 的预测精度,还为其他气候敏感型疾病的建模和预测提供了参考。在未来的公共卫生研究中,类似的混合模型可能会被广泛应用,以应对日益复杂的疾病传播模式和环境变化带来的挑战。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号