编辑推荐:
为解决全球人口分布数据的问题,Oak Ridge National Laboratory 研究人员开展 LandScan Global 数据集研究,得出高分辨率数据集,为多领域提供支持。
在当今数字化时代,全球人口分布数据对于众多领域至关重要。从应对自然灾害时精准定位受灾人群,到城市规划中合理布局基础设施,再到公共卫生领域预测疾病传播风险,都离不开精确的人口分布信息。然而,现有的全球栅格化人口数据集(GGPDs)却存在诸多问题。像 GPW 在人口分布假设上过于简单,GRUMP 受夜间灯光数据影响易产生偏差,GHS-POP 存在定居覆盖数据不完整的缺陷,WorldPop 的人口插值方法也可能导致结果不准确。这些问题使得它们在不同场景下的适用性大打折扣,无法满足人们对高精度人口数据的需求。
为了填补这一数据缺口,美国橡树岭国家实验室(Oak Ridge National Laboratory)的研究人员开展了 LandScan Global(LSG)数据集的研究。他们的目标是创建一个能更准确反映全球环境人口分布(即 24 小时平均且无预警的人口分布)的数据集,以满足美国联邦政府、学术界、人道主义组织等在应急响应、灾害恢复、政策规划等多方面的需求。经过多年努力,研究人员成功开发出了 LSG 数据集,并在《Scientific Data》上发表了相关成果。这一数据集自发布以来,在众多领域发挥了重要作用,像在 2004 年印度洋海啸、2010 年海地地震以及叙利亚内战、2022 年俄乌冲突等灾害和危机中,都为相关工作提供了有力支持。
在研究过程中,研究人员运用了多种关键技术方法。首先是数据融合技术,将来自不同渠道的人口数据、地理数据等进行整合,包括各国行政单位的人口统计数据、各种地理边界数据,以及道路、土地覆盖、建筑物特征等辅助数据。其次,利用地理信息系统(GIS)技术处理和分析这些空间数据,为后续建模提供基础。再者,采用了多变量面积权重法(dasymetric modelling),结合辅助指标数据集生成的加权系数和源区域数据,将人口普查数据分解到 30 弧秒的网格单元中,实现更精细的人口分布模拟。同时,还运用了机器学习算法,特别是在处理建筑物特征提取等数据时,提高了数据的准确性和模型的性能。
研究结果主要体现在以下几个方面:
- 数据集构建与更新:LSG 数据集从 2000 年到 2022 年逐年更新,通过整合最新的辅助数据和人口统计信息,不断优化模型。在构建过程中,研究人员针对不同国家的特点,建立了独立的模型。例如,对于有 LandScan HD 或 LandScan USA 数据支持的国家,利用其高分辨率数据进行人口估计;对于其他国家,则采用不同的流程,结合最新的辅助数据集,通过多次迭代和验证来确定最终的系数和人口分布。
- 模型验证与改进:研究人员通过多种方式对 LSG 模型进行验证。在 “花生酱涂抹” 现象(peanut butter smears,即行政单位内各网格细胞人口数相同的现象)的评估中,发现绝大多数行政单位的标准差大于零,表明 LSG 数据集避免了这种均匀分布的情况,人口分布更具差异性。在手动验证和修改方面,研究人员利用卫星图像和实地知识,对模型输出进行调整。像在阿塞拜疆的阿格达姆地区,通过手动降低人口估计值,准确反映了该地区作为鬼城的实际情况;在巴林、埃及开罗等城市,根据城市发展情况调整系数,使模型更能反映人口变化。从时间序列上看,2000 年至 2022 年,每单元格人口范围显著增加,零人口单元格数量增多,这意味着模型能够更好地识别和去除无人居住区域的人口,提高了人口分布的精度。通过与美国人口普查数据对比,虽然存在差异,但这种差异反映了 LSG 数据集对环境人口的捕捉能力,如在一些多用途区域,两者的估计有较强的一致性。
- 数据可用性与应用:LSG 数据集可在 figshare 和橡树岭国家实验室的网站上免费获取,其数据格式和坐标系统便于用户进行地理空间分析。该数据集的主要用途是估计风险或无预警人口,适用于经济活动、国家安全、反恐、政策规划、应急响应等多个领域,为这些领域的决策提供了重要的数据支持。
研究结论表明,LSG 数据集在全球人口分布研究方面具有独特优势。它通过环境人口建模,更真实地反映了人们在一天中不同时刻的可能位置;整数人口计数格式既符合实际情况,又保证了与历史数据集的一致性;可适应的人口解聚方法和国家特定模型,使其能更好地应对不同地区的复杂情况;手动验证和编辑过程进一步提高了数据的准确性。然而,研究也存在一些局限性,如模型构建过程中人工干预较多,难以完全复制;由于缺乏全球尺度的地面真实数据,数据集的准确性难以精确评估。尽管如此,LSG 数据集为全球人口分布研究和相关领域的应用提供了重要的参考,推动了多学科的发展,在应急管理、灾害响应、城市规划等实际应用场景中发挥着不可替代的作用,为人类社会的可持续发展做出了重要贡献。未来,随着技术的不断进步和数据的持续积累,LSG 数据集有望进一步优化,为解决更多全球性问题提供更强大的数据支持。