基于地理空间大数据云计算的巴西登革热影响因素时空数据集构建与应用

【字体: 时间:2025年04月30日 来源:Scientific Data 5.8

编辑推荐:

  为解决巴西登革热环境影响因素数据覆盖不全、处理效率低的问题,中国科学院地理科学与资源研究所等团队通过Google Earth Engine平台整合多源地理空间大数据,构建了涵盖12种环境因子(如温度、降水、NDVI等)的巴西558个微区域1252周人口加权数据集。该研究为登革热传播机制分析和风险预测提供了标准化数据支持,相关方法可推广至其他虫媒传染病研究。

  

登革热作为全球增长最快的虫媒传染病,在巴西呈现爆发式蔓延,2024年前两个月病例已超百万。传统研究依赖气象站观测数据,存在空间覆盖不足、处理效率低下等问题,尤其在大尺度分析中难以构建完整的致病环境因子数据集。这一瓶颈严重制约了公共卫生部门对登革热传播机制的认知和预警模型的优化。

针对这一挑战,中国科学院地理科学与资源研究所联合宁波诺丁汉大学等机构的研究团队,创新性地利用Google Earth Engine(GEE)云平台,整合ERA5-Land气象数据、MODIS植被指数、GHSL建筑数据等多源地理空间大数据,开发了覆盖巴西558个微区域、1252个流行病学周(2001-2024年)的高精度数据集。该研究首次实现了12种关键环境因子(包括周降水量、极端温度、NDVI、GDP等)的人口加权空间聚合,解决了传统方法在无人区数据干扰和时空分辨率不匹配的问题。论文发表于《Scientific Data》期刊。

研究采用三大关键技术:1)基于GEE平台的并行计算框架,处理PB级卫星和再分析数据;2)人口加权算法(使用WorldPop 100米分辨率人口数据)优化环境因子空间表征;3)多尺度验证体系(对比巴西265个气象站观测数据),证实数据集在降水(r=0.61)、湿度(r=0.78)等指标的可靠性。

数据记录与方法
通过构建微区域尺度(558个单元)的标准化处理流程,数据集包含:周累计降水量(ERA5-Land 11km数据)、极端温度(2米气温)、帕尔默干旱指数(PDSI)等12类指标。其中GDP和建筑表面积采用年际插值处理,NDVI数据截至2022年。

技术验证
与INMET气象站数据的对比显示:人口加权后的周均湿度(r=0.78,p=0.02)和气压(r=0.83)相关性最高,验证了数据集的可靠性。但受云平台数据同化限制,在观测稀疏区域可能存在系统偏差。

使用说明
该数据集不仅适用于登革热研究,还可拓展至基孔肯雅热、黄热病等同媒介传染病。但需注意2021-2024年人口数据采用2020年替代,且GDP等年度变量无法反映周尺度变化。

这项研究的意义在于:1)创建了首个巴西全国尺度的登革热环境驱动因子标准化数据集;2)开发的可扩展云平台框架为其他传染病研究提供范式;3)人口加权算法创新性地将人类活动纳入环境因子计算,更精准反映疾病传播的真实暴露场景。研究人员公开了全部JavaScript和Python代码,推动地理空间大数据在公共卫生领域的跨学科应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号