一种优化的地理分层集成模型,用于预测美国因呼吸道病毒导致的住院病例

《Enzyme and Microbial Technology》:An optimized geo-hierarchical ensemble model to forecast hospitalizations from respiratory viruses in the United States

【字体: 时间:2025年11月25日 来源:Enzyme and Microbial Technology 3.7

编辑推荐:

  准确预测流感、COVID-19和RSV的短期医院化率对公共卫生响应至关重要。本研究提出地理层次优化集成模型(OGEM),通过整合州级、区域级和国家级多病原预测模型,结合动态聚类和优化加权方法,显著提升预测精度。实验表明OGEM在MAE和WIS指标上均优于CDC官方模型,尤其在峰值期和转折点表现突出,验证了多尺度时空建模和自适应加权策略的有效性。

  ### 模型背景与研究意义

随着全球公共卫生挑战的不断演变,精准预测传染病的传播趋势变得尤为重要。尤其是在面对像流感、冠状病毒(如新冠病毒)和呼吸道合胞病毒(RSV)等呼吸道疾病的爆发时,及时且准确的预测不仅有助于制定有效的公共卫生应对措施,还能为医疗资源的合理配置提供科学依据。然而,现有的预测模型大多集中于单一病原体的独立预测,缺乏对多种病原体之间相互作用的深入理解,这在应对多重传染病共存的“三重疫情”(tripledemic)时显得尤为不足。

在新冠疫情期间,公共卫生措施如戴口罩、社交距离和减少旅行等显著降低了其他呼吸道病毒的传播率,但随着这些措施的放松,流感、新冠和RSV的共同传播对全球医疗系统造成了前所未有的压力。特别是在2022年10月,婴儿的RSV住院率创下了历史新高,同时流感和新冠的住院病例也大幅上升。这种复杂的流行病学背景表明,构建一个能够综合多种病原体数据并进行跨病原体预测的模型具有重要的现实意义。

此外,新冠后时代的公共卫生挑战更加复杂,因为病毒的传播模式、症状表现和免疫反应都发生了变化。为了应对这些挑战,研究者们正在探索如何利用跨病原体的共享指标来改进预测模型。尽管一些研究已经证明了新冠与流感之间存在一定的相关性,可以利用流感数据预测新冠趋势,反之亦然,但这些方法通常缺乏系统性和可扩展性。因此,开发一个能够综合考虑多种病原体动态变化、优化模型权重,并适应不同地理尺度的预测框架成为当务之急。

### OGEM模型的核心理念与结构

为了解决上述问题,本研究提出了一种名为“通用优化地理分层集成模型”(Generalized Optimized Geo-Hierarchical Ensemble Model, OGEM)的新型预测框架。该模型的核心思想是通过整合不同地理层级的模型,即州级、区域级和国家级模型,利用集成方法提高预测的准确性和稳定性。此外,OGEM还引入了多种权重优化策略,以动态调整各模型在预测中的贡献比例,从而增强模型的整体表现。

OGEM的结构分为三个主要部分:**州级模型**、**区域级模型**和**国家级模型**。州级模型主要基于Holt-Winters加法模型,这是一种简单但有效的单变量时间序列预测方法,特别适用于数据量有限的情况。区域级模型则通过聚类算法,将具有相似住院趋势的州划分为若干区域,并在每个区域内训练独立的模型。这些区域的划分依据是短期或长期的住院趋势,通过动态调整,能够更好地捕捉地区性的疾病传播模式。国家级模型则基于所有州的数据进行训练,以反映全国范围内的流行趋势。

为了进一步提升预测效果,OGEM还结合了多种优化方法,包括直接平均、基于平均绝对误差(MAE)的反向加权、基于预测时间范围的反向加权以及线性规划(LP)等。这些方法旨在根据模型的历史表现动态调整其权重,从而在不同时间尺度上提高预测的准确性。例如,在短期预测中,反向加权方法可以更精确地识别那些表现更优的模型,减少误差的影响;而在长期预测中,线性规划方法则能够根据模型在最近一周的表现进行优化,确保预测结果的稳定性。

### 数据来源与处理方法

为了构建OGEM模型,研究团队整合了多种数据源,包括**症状调查数据**、**医疗索赔数据**、**流行病学数据**和**污水监测数据**。这些数据提供了对呼吸道疾病传播动态的多维度理解,能够更全面地反映疾病的传播趋势。

症状调查数据主要来源于谷歌搜索趋势,通过分析与呼吸道疾病相关的关键词搜索量,可以作为公众对疾病的关注度和潜在传播的早期信号。医疗索赔数据则记录了门诊和住院患者的就诊情况,能够反映疾病的实际影响和医疗系统的应对能力。流行病学数据包括传统的传染病监测数据,用于验证模型的预测结果。对于新冠,还特别引入了**污水监测数据**,以追踪社区层面的病毒传播情况。

在数据处理过程中,研究团队对所有数据进行了标准化处理,确保不同来源的数据具有可比性。同时,为了弥补数据缺失,采用了线性插值的方法,使数据序列更加完整。对于RSV而言,由于其数据覆盖范围有限(仅12个州),模型主要基于州级和国家级数据进行训练,以确保预测的准确性和稳定性。

### 模型性能评估与结果分析

为了评估OGEM模型的性能,研究团队采用了**平均绝对误差(MAE)**和**加权区间得分(WIS)**作为主要评价指标。这些指标能够衡量预测模型在不同时间尺度上的准确性和分布特征。在实际应用中,MAE越小,表示模型的预测越接近真实值;而WIS则反映了模型在预测区间内的不确定性。

在对流感的预测中,OGEM模型表现尤为突出。以使用长期趋势聚类的模型为例,其在1至4周的预测中,MAE分别为0.365、0.619、0.869和0.997,WIS分别为0.302、0.429、0.560和0.643。与传统的流感预测模型(如FluSight基准模型和集成模型)相比,OGEM在多个时间尺度上都表现出显著的性能提升。尤其是在流感高峰期,模型的预测误差更低,能够更准确地反映疾病的传播趋势。

对于新冠的预测,OGEM模型同样展现出优越的性能。以使用长期趋势聚类的模型为例,其在1至4周的预测中,MAE分别为0.678、1.04、1.43和1.92,WIS分别为0.497、0.698、0.874和1.14。与CDC的新冠基准模型和集成模型相比,OGEM在多个时间尺度上均表现出更高的预测精度,尤其是在短期预测中,其优势更加明显。此外,通过**威尔科克森符号秩检验**(Wilcoxon Signed-Rank Test),研究团队进一步验证了OGEM模型在所有预测时间范围内均优于现有模型,其性能提升具有统计学意义。

在RSV的预测中,由于缺乏官方的集成模型,研究团队主要依赖于MAE和WIS指标进行评估。结果显示,RSV的预测误差相对较低,表明其传播模式比流感和新冠更为稳定。这进一步证明了OGEM模型在处理不同病原体时的适应性和可靠性。

### 模型优化与实际应用

为了进一步优化模型的预测效果,研究团队还对不同聚类方法和集成策略进行了敏感性分析。结果显示,基于长期趋势的聚类方法在流感预测中表现出更高的准确性和稳定性,相较于使用HHS行政区域划分或短期趋势聚类的方法,其预测误差更小,且极端值更少。此外,优化的集成方法(如RECI和LP)在不同时间尺度上都表现出显著的性能提升,尤其是在预测转折点时,能够更准确地捕捉疾病传播的变化趋势。

在实际应用中,OGEM模型已被用于多个实时预测竞赛,如2023–2024年的FluSight挑战赛。模型在比赛中取得了前五名的成绩,表明其在实际应用中的有效性。然而,随着疫情的发展,数据的可用性成为影响模型性能的重要因素。例如,在2024–2025年流感季节,由于部分数据(如症状调查数据和医疗索赔数据)的缺失,OGEM模型的预测效果有所下降,仅达到平均水平。这说明,模型的性能高度依赖于数据的完整性和及时性。

### 模型的局限性与未来发展方向

尽管OGEM模型在多个方面表现出色,但其仍存在一些局限性。首先,模型的权重优化依赖于历史表现,这可能在某些情况下导致预测误差的增加,尤其是当某些模型在未来的表现发生变化时。其次,部分数据源(如医疗索赔数据和谷歌趋势数据)随着时间的推移变得不那么容易获取,这限制了模型的可扩展性。此外,RSV的预测仍面临数据覆盖不足的问题,目前仅限于12个州,因此难以构建具有广泛适用性的区域级模型。

为了克服这些局限性,研究团队建议未来应加强对公共卫生数据的开放性和标准化,以确保模型能够充分利用最新的数据进行预测。同时,随着RSV数据的进一步扩展,区域级模型的构建将成为可能,从而提升模型的预测能力。此外,研究团队还计划在实时预测中引入更灵活的权重调整策略,以应对不断变化的流行病学环境。

### 结论与展望

本研究提出的OGEM模型为多重呼吸道疾病的预测提供了一个新的思路。通过整合不同地理层级的模型,结合多种权重优化方法,OGEM在流感、新冠和RSV的预测中均表现出较高的准确性和稳定性。特别是在应对“三重疫情”时,该模型能够有效捕捉不同病原体之间的相互作用,为公共卫生决策提供更全面的参考依据。

未来,随着数据的进一步完善和模型的持续优化,OGEM有望成为一种广泛应用的预测工具。它不仅可以用于短期预测,还可以扩展到更长的时间范围,为公共卫生机构提供更长时间跨度的预测支持。此外,模型的灵活性和可扩展性使其能够适应不同的流行病学场景,从而在应对未来可能的多重疫情时发挥更大的作用。研究团队相信,OGEM的提出将为全球公共卫生领域的预测研究带来重要的推动,有助于提升疾病防控的科学性和时效性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号