
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于2020年中国乡镇级人口普查的百米分辨率年龄分层人口估算数据集(ASPECT)的构建与应用
【字体: 大 中 小 】 时间:2025年06月22日 来源:Scientific Data 5.8
编辑推荐:
本研究针对中国高精度人口空间分布数据不足的问题,开发了基于2020年最新人口普查的乡镇级年龄分层人口估算数据集(ASPECT)。研究人员通过整合40,718个乡镇的人口数据,结合随机森林模型和多元空间协变量,构建了100米分辨率的全年龄段人口分布图谱。该数据集显著提升了人口暴露评估和环境健康研究的精度,为脆弱人群(0-14岁和≥65岁)的空间分析提供了关键基础数据。
在全球城市化进程加速的背景下,精确掌握人口空间分布已成为环境健康、灾害管理和公共服务资源配置的核心课题。传统人口普查数据受限于行政单元边界,难以反映真实的人口聚集特征,而现有全球网格化人口数据集(如WorldPop)在中国地区存在数据滞后(基于2010年普查)和空间分辨率不足(多基于县级数据)的双重局限。更棘手的是,老年人和儿童等脆弱人群的空间分布异质性长期缺乏高精度数据支撑,这直接影响了气候变化适应性规划、公共卫生资源配置等重大决策的科学性。
针对这一系列挑战,南京大学地理与海洋科学学院联合建筑与城市规划学院的研究团队,在《Scientific Data》发表了题为"100-m resolution Age-Stratified Population Estimation from the 2020 China Census by Township"的创新研究。该研究首次利用2020年中国人口普查中最细粒度的乡镇级数据(覆盖40,718个行政单元),开发了包含全年龄段人口的百米分辨率网格化数据集ASPECT。通过整合卫星遥感(如ESA WorldCover)、建筑高度(CNBH-10m)、夜间灯光(VIIRS)等12类空间协变量,采用随机森林算法进行空间降尺度建模,最终生成的年龄分层数据(0-14/15-59/60-64/≥65岁)展现出比WorldPop高3-5倍的空间变异度。
关键技术方法包括:(1)通过民政部门公告和开放地图数据更新2019-2020年间768个变更乡镇的边界;(2)构建包含建成区比例、建筑高度、道路可达性等预测因子的随机森林回归模型;(3)采用居住区掩膜技术优化人口分布权重;(4)通过县级数据反向验证确保模型可靠性。研究特别强调,所有协变量均统一至100m分辨率,且年龄分层数据通过独立建模获得,避免常规的比例分配法导致的空间平滑效应。
【数据记录】
ASPECT以GEOTIFF格式存储,包含总人口密度(人/公顷)和四个年龄组人口比例图层。区别于常规数据集,该研究特别提供了两种总人口估算结果:直接建模值(population_total_pop.tif)与年龄组加总值(population_total_pop_sum.tif),后者验证了数据内部一致性(城市尺度相关系数达0.96)。
【技术验证】
模型验证显示,乡镇级回归模型的R2介于0.75-0.83,其中总人口预测精度最高(RMSE=18.01人/公顷)。建筑高度被证明是最强预测因子(见图5),其重要性是第二预测因子POI密度的2-3倍。

【结论与意义】
该研究建立了中国首个基于最新人口普查的乡镇级年龄分层人口网格数据集,其创新性体现在:(1)突破性地整合了2020年普查中最细粒度的40,718个乡镇数据,较现有数据集(如PopSE的15,564个样本)提升2.6倍覆盖率;(2)首次实现中国全域百米尺度年龄结构空间异质性量化,为精准识别"老年友好型社区"或"儿童安全区域"提供新工具;(3)开发的边界更新方法(涉及502,418km2调整区域)为处理行政变更数据树立了新标准。这些突破使得ASPECT能更准确地评估极端气候事件中的脆弱人群暴露风险,例如海平面上升对老年社区的影响研究(参见文献5)。数据集已开源共享,其方法论框架也可推广至其他发展中人口大国的精细人口制图工作。
生物通微信公众号
知名企业招聘