
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双重多任务高斯过程的COVID-19跨区域动态预测模型研究
【字体: 大 中 小 】 时间:2025年07月14日 来源:Journal of Biomedical Informatics 4.0
编辑推荐:
本文针对COVID-19疫情预测中病例与死亡数的强相关性及跨国传播动态,提出双重多任务高斯过程(DMTGP)模型,结合Transformer注意力机制捕捉东亚三国(日、韩、台)疫情交互特征,实验表明其预测性能优于基线模型,为传染病跨区域联合建模提供新范式。
2020年初爆发的COVID-19疫情对全球公共卫生体系提出严峻挑战,尤其东亚地区因密切的社会经济联系面临复杂的跨区域传播风险。传统流行病模型难以同时捕捉病例与死亡数的任务相关性(日本相关系数0.72)及国家间动态交互(如2022年7-10月三国疫情趋势高度同步),而单一国家预测往往忽略疫苗接种等社会因素的跨境影响。
韩国延世大学(Yonsei University)的研究团队在《Journal of Biomedical Informatics》发表研究,构建覆盖日、韩、台三地的多变量时间序列数据库(2020/2/27-2023/2/8),提出双重多任务高斯过程(Doubly Multi-Task Gaussian Process, DMTGP)框架。该模型创新性地将多任务高斯过程(MTGP)与Transformer编码器结合:MTGP处理单国内部病例与死亡数的联合预测,而注意力机制动态计算三国疫情数据的交叉关联权重。实验证明DMTGP在六项预测任务(三国×病例/死亡数)中均超越单一任务GP、LSTM等基线模型,注意力图谱可视化显示其能有效捕捉不同时期国家间的疫情传播模式差异。
关键技术包括:1)构建含9变量的跨国数据集(含气候、社会特征);2)MTGP建模任务间协方差矩阵;3)Transformer编码器生成跨国家注意力得分;4)贝叶斯优化超参数。
【数据描述】
整合三国1,084天的流行病学、气候和社会数据,其中确诊病例(Confirmation)和死亡数(Dead)作为预测目标,其余7项(如疫苗接种率、温度)作为输入特征。
【方法论】
设计"双重多任务"架构:国家间共享特征提取网络,各国独立MTGP预测头。通过分层协方差矩阵(国家层+任务层)建模复杂依赖关系,注意力模块权重分配反映国家间动态影响强度。
【实验结果】
在均方根误差(RMSE)指标上,DMTGP相比最佳基线模型提升19.3%。注意力图谱显示2021年日韩交互权重达0.68,而台湾地区在奥密克戎流行期(2022冬)成为主要影响源。
该研究开创性地将神经模块与概率模型结合,其动态关系建模能力可扩展至其他传染病预测。韩国食品药品安全部(MFDS)资助的应用验证表明,该模型能辅助制定差异化的边境管控策略。局限在于未纳入病毒变异株亚型数据,未来拟结合图神经网络增强空间依赖建模。
生物通微信公众号
知名企业招聘