
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种用于预测中国四川省结核病发病率的新型时间序列建模框架
《BMC Infectious Diseases》:A novel time-series modeling framework for predicting tuberculosis incidence in Sichuan, China
【字体: 大 中 小 】 时间:2026年06月11日 来源:BMC Infectious Diseases 3
编辑推荐:
摘要目的结核病(TB)仍然是中国四川省主要的传染病和公共卫生问题。本研究旨在探索并验证一种新型的自适应混合模型,该模型结合了集合经验模态分解(EEMD)、季节性自回归积分移动平均(SARIMA)和指数平滑(ES)方法,并首次将其应用于中国四川省结核病发病率的预测。方法我们收集了2
结核病(TB)仍然是中国四川省主要的传染病和公共卫生问题。本研究旨在探索并验证一种新型的自适应混合模型,该模型结合了集合经验模态分解(EEMD)、季节性自回归积分移动平均(SARIMA)和指数平滑(ES)方法,并首次将其应用于中国四川省结核病发病率的预测。
我们收集了2006年至2020年中国四川省的月度结核病发病率数据,并将时间序列分为训练集和测试集。数据集包含180个月度数据点,按8:2的比例进行划分,训练集涵盖2006年至2017年(144个月),测试集涵盖2018年至2020年(36个月)。随后,基于训练集开发了SARIMA、ES和EEMD-SARIMA-ES混合模型。使用一系列指标评估了这些模型的预测性能,包括均方误差(MSE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。
2006年至2020年的结核病发病率表现出明显的季节性和周期性特征。最优的ES模型是Holt-Winters加性模型(BIC=-0.845;残差:Ljung Box Q = 22.721,p > 0.05)。最优的SARIMA模型是SARIMA(1,0,0)(0,1,1)12(AIC = 282.18,BIC = 293.71;残差:Ljung Box Q = 0.079,p > 0.05)。构建的EEMD-SARIMA-ES混合模型在训练集(MSE = 3.5050,MAPE = 6.69%,RMSE = 4.9568)和测试集(MSE = 0.6897,MAPE = 3.92%,RMSE = 0.9754)上都表现出更优的预测性能,优于单独使用ES或SARIMA模型。
EEMD-SARIMA-ES混合模型有效捕捉了中国四川省的结核病发病率趋势。该模型可作为四川省结核病监测和预警的有效工具。
结核病(TB)仍然是中国四川省主要的传染病和公共卫生问题。本研究旨在探索并验证一种新型的自适应混合模型,该模型结合了集合经验模态分解(EEMD)、季节性自回归积分移动平均(SARIMA)和指数平滑(ES)方法,并首次将其应用于中国四川省结核病发病率的预测。
我们收集了2006年至2020年中国四川省的月度结核病发病率数据,并将时间序列分为训练集和测试集。数据集包含180个月度数据点,按8:2的比例进行划分,训练集涵盖2006年至2017年(144个月),测试集涵盖2018年至2020年(36个月)。随后,基于训练集开发了SARIMA、ES和EEMD-SARIMA-ES混合模型。使用一系列指标评估了这些模型的预测性能,包括均方误差(MSE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。
2006年至2020年的结核病发病率表现出明显的季节性和周期性特征。最优的ES模型是Holt-Winters加性模型(BIC=-0.845;残差:Ljung Box Q = 22.721,p > 0.05)。最优的SARIMA模型是SARIMA(1,0,0)(0,1,1)12(AIC = 282.18,BIC = 293.71;残差:Ljung Box Q = 0.079,p > 0.05)。构建的EEMD-SARIMA-ES混合模型在训练集(MSE = 3.5050,MAPE = 6.69%,RMSE = 4.9568)和测试集(MSE = 0.6897,MAPE = 3.92%,RMSE = 0.9754)上都表现出更优的预测性能,优于单独使用ES或SARIMA模型。
EEMD-SARIMA-ES混合模型有效捕捉了中国四川省的结核病发病率趋势。该模型可作为四川省结核病监测和预警的有效工具。
生物通微信公众号