基于千万级手机数据的上海城市公园动态访问网络构建与公平性研究

【字体: 时间:2025年07月19日 来源:Scientific Data 5.8

编辑推荐:

  本研究利用上海1000万匿名用户的手机数据,构建了名为GreenMove的动态访问网络,首次实现了从居住区多边形到公园的真实人口级连接分析。通过整合POI核密度估计、房价指数和天气数据等多元属性,研究量化了公园需求与吸引力指标,为城市绿地公平性规划和健康城市建设提供了数据支撑。

  

在现代城市化进程中,公园作为重要的绿色基础设施,被证实能带来社会、经济、环境和健康等多重效益。然而全球南方城市平均绿地暴露率仅为14.39%,中国城市公园布局存在明显的"需求-供给"失衡问题。传统研究依赖地理缓冲区假设,忽视真实人群流动行为;而疫情期间的主动上报机制又因隐私保护难以持续。如何精准捕捉城市公园使用模式,成为优化绿地规划的关键科学问题。

上海交通大学人工智能研究院和数据驱动管理决策实验室的研究团队创新性地利用2014年1-4月上海1000万匿名用户的手机信令数据,通过时空聚类算法识别公园访问行为,构建了覆盖38405个居住区多边形与394个公园的动态二分网络GreenMove。该研究突破性地将公园访问网络扩展到真实人口规模,同时整合住房价格、POI核密度(KDE)和精细化天气数据等多维属性,相关成果发表在《Scientific Data》期刊。

研究采用四大关键技术:1)基于TimeGeo模型设置时空阈值(10分钟/300米)识别停留点;2)通过稳定访问模式筛选(≥8次/4个月)确保数据可靠性;3)利用基站位置构建Voronoi网格替代行政分区,实现38,055个居住区多边形划分;4)结合2020年人口普查数据进行两阶段人口扩样。验证显示手机用户分布与普查人口相关性达0.98,八个公园的实测流量验证相关性超0.9。

研究结果部分:
背景与概要:揭示现有公园研究数据存在用户覆盖有限(如仅1.5万手机ID)、时间跨度短(最短24小时)、空间偏差(仅采样公园)和属性孤立四大局限。GreenMove首次实现全城市公园网络的多时间-多属性覆盖。

方法:通过网格聚类识别家庭/工作/公园三类停留区域,采用50米公园缓冲区解决小公园覆盖问题。过滤超过12小时(占3.23%)和跨夜(占3.68%)的非休闲访问,最终保留1,454万条稳定访问记录。

数据记录:构建113天的动态网络(含452个时段网络),节点含居住区(含23项POI属性)和公园两类,边权重含流量(flow)、通勤比例(commuter_ratio)和距离(distance)等属性。超级网络分析显示节点符合幂律分布。

技术验证:KS统计验证访问频次阈值8的合理性;SHAP分析表明多边形人口、公园面积和距CBD距离是预测访问量的三大关键因子(GBM模型R2=0.79)。

结论与讨论部分:
该研究创建了首个融合真实人口流动与社会经济属性的城市公园动态网络数据集,突破传统静态分析的局限。通过量化居住区-公园连接强度,为"15分钟社区生活圈"规划提供实证依据;通勤比例的时间模式分析(工作日傍晚达26.7%)揭示了公园功能分化特征。研究特别强调2014年作为上海公园快速扩张前的基准年价值,其建立的访问模式基线有助于追踪城市化进程中人-公园互动关系的演变。数据集已开源在figshare平台(DOI:10.6084/m9.figshare.28581515),不仅支持绿地公平性研究,更为理解城市形态演变提供时空参照系。未来可结合多年度数据开展纵向研究,探索城市扩张对居民绿色空间获得感的影响机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号