网络时间序列分析新工具在COVID-19住院预测中的应用与GNAR模型评价
【字体:
大
中
小
】
时间:2025年10月05日
来源:Journal of the Royal Statistical Society Series A: Statistics in Society 1.5
编辑推荐:
本刊推荐:针对多时间序列依赖关系挖掘难题,Nason团队开发了基于网络结构的GNAR模型,通过邻域序列线性组合预测COVID-19床位占用。研究表明该模型能有效提取共同信号降低噪声,虽平均预测误差降低幅度有限,但对基础趋势预测具有实质改进意义。
在公共卫生危机管理中,准确预测医疗资源需求是保障医疗系统稳定运行的关键。COVID-19大流行期间,医院机械通气床位的占用情况直接反映了疫情对医疗系统的压力程度。然而,传统的时间序列预测方法在面对多地区、多医院的床位占用数据时往往捉襟见肘——这些数据不仅具有典型的时间自相关性,还包含着复杂的空间依赖关系。更棘手的是,这些观测值都是整数且均值较低,经过对数变换后会在低值区域产生极大波动性,这给精确预测带来了巨大挑战。
正是为了解决这一难题,Nason及其团队在《Journal of the Royal Statistical Society Series A: Statistics in Society》上发表了一项创新研究,开发了专门针对网络结构时间序列的新分析工具。他们提出的广义网络自回归(GNAR)模型巧妙利用了时间序列之间的空间结构关系,通过将每个序列的邻近序列线性组合作为预测因子,从而能够更准确地捕捉疫情发展中的复杂模式。
研究人员采用的方法主要包括:构建医院网络结构并定义空间邻接关系;利用GNAR模型框架建立时间与空间维度的预测模型;通过模型选择技术确定最优的网络范围和时间滞后阶数;使用平均平方预测误差(MSPE)作为模型性能评价指标。特别值得注意的是,研究使用了英国140家医院的机械通气床位占用真实数据,这些数据来自曼彻斯特、伯明翰和伦敦等疫情重点地区。
研究团队首先建立了医院网络,其中每个节点代表一家医院,边表示医院之间的空间或管理关系。GNAR模型在此基础上引入,其核心思想是每个医院的时间序列不仅受自身历史值影响,还受到网络中相邻医院历史值的影响。通过系统性的模型拟合和选择过程,研究人员确定了最优的邻域范围和时间滞后结构。
与朴素预测器(仅使用前一期值预测)和AR(1)模型相比,GNAR模型显示出虽然 modest 但确实存在的预测改进。Tunnicliffe-Wilson指出,原始论文中报告的AR(1)模型MSPE可能存在计算差异,他自己的计算结果为7.4。更重要的是,在序列呈现局部趋势的阶段,双指数平滑模型(设计用于捕捉变化水平和趋势)的表现优于AR(1)和朴素预测器。
对那些床位占用均值较低的医院序列,预测尤其困难。整数性质和对数变换后的高变异性使得任何预测方法都面临固有误差。然而,GNAR模型通过组合相关网络序列,提取共同信号并降低噪声,在这方面展现了独特价值。
分析发现,均值最高的五家医院(来自曼彻斯特、伯明翰和伦敦)表现出强烈的低频协同性。这表明这些主要医疗中心的床位需求变化具有高度同步性,进一步证实了利用网络结构信息进行预测的科学基础。
研究表明,GNAR模型为多变量时间序列预测提供了一种有效且简洁的解决方案。尽管预测误差的绝对降低幅度可能不大,但对底层运动趋势的预测改善具有实质意义。这种方法特别适用于像COVID-19床位需求这样的场景,其中空间依赖性和时间动态同样重要。Tunnicliffe-Wilson的评论进一步强调了考虑数据特性(如整数性质和低均值问题)在选择适当模型时的重要性,以及在不同疫情阶段可能需要采用不同预测策略的现实需求。
这项工作的意义不仅限于COVID-19预测,更为未来公共卫生危机中的资源规划提供了方法论支持。通过有效利用网络结构信息,决策者能够更准确地预见医疗需求变化,从而做出更科学合理的资源分配决策。这种基于统计网络的建模思路也有望扩展到其他具有空间结构的多变量时间序列预测领域,如传染病传播、经济指标预测和环境监测等。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号