基于时间序列和深度学习模型对新疆艾滋病月发病率预测的研究成果

【字体: 时间:2025年02月26日 来源:BMC Public Health 3.5

编辑推荐:

  本研究针对新疆艾滋病(AIDS)高发病率问题,采用时间序列和深度学习模型预测月发病率,发现ETS(A,A,A)模型预测性能最佳,为艾滋病防控提供科学依据。

  艾滋病(AIDS)作为一种严重威胁人类健康的传染病,其发病率的准确预测对于公共卫生防控具有重要意义。新疆作为中国艾滋病高发地区之一,面临着严峻的防控压力。为了更好地预测新疆艾滋病的月发病率,提供科学的防控依据,新疆医科大学的研究人员开展了一项基于时间序列和深度学习模型的研究。该研究通过对比多种模型的预测性能,揭示了ETS(A,A,A)模型在预测新疆艾滋病月发病率方面的优势,并探讨了深度学习模型在时间序列预测中的潜力,研究成果发表在《BMC Public Health》上。

研究背景与意义

艾滋病(Acquired Immunodeficiency Syndrome, AIDS)是由人类免疫缺陷病毒(Human Immunodeficiency Virus, HIV)引起的一种高致死性传染病。自1981年首次在美国报告病例以来,艾滋病迅速传播至全球100多个国家和地区。根据世界卫生组织(World Health Organization, WHO)报告,截至2020年底,全球约有3770万人感染HIV,2021年新增感染150万人,死亡65万人。尽管全球在艾滋病防控方面取得了显著进展,但整体形势依然严峻,许多患者仍未得到有效治疗。在中国,截至2020年10月,报告存活的HIV感染者达104.5万人,当年新增艾滋病感染11.2万人。新疆作为中国艾滋病高发地区,自1995年报告首例HIV感染者以来,疫情已扩散至全区所有县市,其年发病率和死亡率均高于全国平均水平,防控任务艰巨。
在传染病防控中,早期监测和预警是核心策略之一。准确预测艾滋病的发病率能够为防控措施的制定、实施和评估提供科学依据。目前,常用的传染病监测和预警模型包括灰色预测模型、传染病动力学模型、深度学习模型和时间序列模型等,其中时间序列模型因其实用性而被广泛应用。然而,随着数据量的增加和模型技术的发展,深度学习模型在时间序列预测中展现出巨大潜力。因此,探索和比较不同模型在艾滋病月发病率预测中的表现具有重要的现实意义。

研究方法

本研究收集了2004年1月至2020年12月新疆艾滋病月发病率数据,采用ARIMA(2,1,2)模型、ARIMA(2,1,2)-EGARCH(2,2)组合模型、ARIMA(2,1,2)-TGARCH(1,1)组合模型、ETS(A,A,A)模型、XGBoost模型和LSTM模型对数据进行拟合和预测。研究中使用了多种技术方法,包括时间序列分析、深度学习算法以及模型性能评估指标(如均方根误差RMSE、平均绝对误差MAE和平均绝对百分比误差MAPE)来比较不同模型的预测能力。数据来源于中国公共卫生科学数据中心的艾滋病数据库,确保了数据的公开性和可重复性。

研究结果

时间序列分析与模型构建

通过对新疆艾滋病月发病率数据的分析,研究人员发现该数据集呈现出明显的波动趋势,分为初始波动期(2004—2007年)、上升期(2008—2012年)、波动期(2013—2019年)和下降期(2020年)。为了构建合适的预测模型,研究人员首先对数据进行了平稳性检验和差分处理,最终确定ARIMA(2,1,2)模型为最优的时间序列模型。在此基础上,进一步引入EGARCH和TGARCH模型以捕捉数据的异方差性,构建了ARIMA-EGARCH和ARIMA-TGARCH组合模型。此外,研究人员还构建了ETS(A,A,A)模型,该模型通过指数平滑法对数据的趋势和季节性进行建模。

深度学习模型的应用

除了传统的时间序列模型,研究人员还探索了深度学习模型在艾滋病月发病率预测中的应用。XGBoost模型作为一种基于决策树的集成学习算法,通过组合多个决策树的结果来提高预测精度。LSTM模型则利用其独特的门控机制,能够有效处理时间序列数据中的长期依赖关系,从而在长序列预测中表现出色。研究中通过调整模型参数,优化了XGBoost和LSTM模型的性能。

模型性能比较

通过对2020年1月至12月的艾滋病月发病率数据进行预测,研究人员比较了六种模型的预测性能。结果表明,ETS(A,A,A)模型在RMSE和MAE指标上表现最佳,分别达到0.274和0.224,表明其预测值与实际值最为接近。ARIMA(2,1,2)-TGARCH(1,1)模型在MAPE指标上表现最佳,为83.562%。然而,综合考虑RMSE、MAE和MAPE三个指标,ETS(A,A,A)模型被认为是预测新疆艾滋病月发病率的最佳模型。此外,LSTM模型也表现出良好的预测性能,其RMSE和MAE值均优于部分传统时间序列模型,显示出深度学习模型在时间序列预测中的巨大潜力。相比之下,XGBoost模型和ARIMA(2,1,2)模型的预测性能相对较弱。

研究结论与讨论

本研究通过比较六种不同的时间序列分析和深度学习模型,得出ETS(A,A,A)模型是预测新疆艾滋病月发病率的最佳模型。该研究不仅为新疆艾滋病的预测和防控提供了有效的工具,还为时间序列预测领域的研究提供了新的思路和方向。尽管如此,研究也存在一定的局限性。例如,模型仅基于历史时间序列数据构建,未考虑其他影响因素(如社会经济因素、公共卫生政策等)对艾滋病发病率的影响。未来的研究可以进一步探索多因素模型,以更准确地预测艾滋病的流行趋势。此外,研究中仅比较了六种模型,可能存在其他更优的模型未被纳入比较,因此结论的普适性需要进一步验证。研究人员建议未来工作可以引入更多先进的模型进行比较,并优化数据预处理和特征选择流程,以进一步提高模型的预测性能。
总之,本研究通过对比多种模型在新疆艾滋病月发病率预测中的表现,揭示了ETS(A,A,A)模型的优势,并强调了深度学习模型在时间序列预测中的潜力,为艾滋病防控提供了重要的科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号