
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Google搜索趋势与向量自回归模型的COVID-19疫情预测研究——以孟加拉国为例
【字体: 大 中 小 】 时间:2025年07月20日 来源:BMC Research Notes 2.8
编辑推荐:
本研究通过向量自回归(VAR)模型分析孟加拉国COVID-19新增病例与Google搜索趋势(GST)的关联性,发现"口罩""洗手"等关键词可提前1-2周预测疫情暴发。研究人员整合"信息流行病学"(Infodemiology)与计量经济学方法,证实GST数据在资源受限地区可作为实时疾病监测工具,为公共卫生决策提供低成本预警方案。论文发表于《BMC Research Notes》。
在COVID-19大流行期间,传统疾病监测系统面临数据滞后1-2周的困境,而资源受限国家更面临检测能力不足、区域数据缺失等挑战。孟加拉国作为人口稠密的发展中国家,其确诊超50万例、死亡率达1.46%的疫情形势,亟需创新监测手段。此时,Google搜索趋势(GST)这类实时反映公众行为的数字足迹,为弥补传统流行病学监测的时效性缺陷提供了可能。
位于孟加拉国锡尔赫特的Shahjalal科技大学经济系研究人员Monir Uddin Ahmed团队,创新性地将经济学领域的向量自回归(VAR)模型引入公共卫生研究。通过分析2020年3月至2022年4月孟加拉国的GST数据与官方疫情报告,发现搜索关键词如"口罩"(FACE)、"洗手"(HAND)等与新增病例(COVID)存在显著统计学关联。这项发表于《BMC Research Notes》的研究证实,GST可作为低成本预警工具,在疫情暴发前1-2周发出信号。
研究采用三大关键技术方法:1)从Google Trends获取标准化搜索量数据,筛选与COVID-19相关的6个核心关键词;2)运用Phillips-Perron检验确保时间序列平稳性后,构建包含滞后项的VAR模型;3)通过格兰杰因果检验和脉冲响应函数,分析GST对新增病例的预测效能。数据来源于孟加拉国卫生服务总局(DGHS)和Our World in Data平台的每周聚合数据。
主要研究发现
滞后效应验证
VAR(2)模型显示,"口罩"搜索量(FACE)的1期滞后项系数为0.264(p<0.05),2期滞后项转为负值(-0.269),表明公众搜索行为对疫情的影响存在1-2周的延迟效应。脉冲响应分析印证该结论,FACE冲击初期会推高病例数,但2周后转为抑制作用。
关键词预测效能差异
格兰杰检验证实"口罩"(FACE)和"症状"(SYMP)能显著预测病例变化(p<0.01),而"洗手"(HAND)和"封锁"(LOCK)的预测力较弱。当加入检测率(TEST)等混杂因素后,模型解释力提升至86%。
防控措施效果评估
脉冲响应函数显示,封锁措施(LOCK)的短期抑制效果有限,响应系数仅-0.307且不显著,反映孟加拉国执法力度不足的现状。相比之下,"洗手"搜索量(HAND)的持续负向响应更显著。
结论与启示
该研究首次在孟加拉国验证了信息流行病学工具的预警价值:GST数据不仅能提前1-2周预测疫情发展,还可评估防控措施效果。特别是在检测资源匮乏地区,这种零成本监测手段能弥补传统系统的不足。但研究也指出GST的局限性——区域互联网覆盖率不均、搜索词选择偏差可能影响结果准确性。
这项跨学科研究为资源受限国家提供了创新解决方案:将经济学VAR模型与公共卫生监测结合,通过挖掘数字足迹实现疫情早期预警。未来可扩展至登革热等其他传染病监测,但需建立标准化关键词库并整合多平台数据。正如作者强调,GST应作为传统监测的补充而非替代,其真正价值在于为公共卫生决策争取宝贵的响应时间窗。
生物通微信公众号
知名企业招聘