随着城市化的快速推进和城市系统复杂性的增加,智慧城市规划在整合和分析多源地理空间数据方面面临着日益增长的挑战(Tang & Waters, 2005)。根据联合国的数据(Huang et al., 2019),预计到2050年,全球超过68%的人口将居住在城市地区,导致城市复杂性和基础设施需求的激增。这种快速的城市化伴随着来自多种来源的地理空间数据量的增加,包括遥感(Bunting et al., 2014)、地理信息系统(GIS)(Shaw & Xin, 2003)、卫星图像(Feizizadeh et al., 2021, Sarvestani et al., 2011)、社交媒体(Shao et al., 2021)和传感器网络(Yu & Fang, 2023)。有效整合和分析这些异构数据对于提高城市韧性、优化基础设施和改善智慧城市环境中的公共服务至关重要(Marzouk and Othman, 2020, Vinasco-Alvarez et al., 2024)。
传统的GIS和遥感方法已被广泛用于城市空间分析,但在处理大规模、多源数据时存在显著局限性(Gao et al., 2022)。传统的GIS平台主要依赖矢量和栅格数据进行空间分析,但难以整合来自社交媒体和传感器网络等动态来源的实时信息(Alam et al., 2022)。此外,数据格式、空间分辨率和时间频率的差异导致了数据整合和分析的复杂性(Crooks & Wise, 2013)。例如,表示道路网络(Jiang et al., 2022)和土地地块的矢量数据可能具有较高的空间精度,但时间分辨率较低,而基于卫星的栅格数据可能更新频繁,但空间分辨率较低(Xia et al., 2022)。这种数据特性的不匹配使得构建适用于智慧城市规划决策的统一地理空间表示变得困难。此外,来自社交媒体和街景图像等非结构化数据的日益增加也带来了额外的挑战(Tang et al., 2021)。现有的GIS和遥感系统主要设计用于处理结构化数据,限制了它们从非结构化或半结构化数据源中提取有意义见解的能力(Singh, 2019, Wilkinson, 1996)。例如,从街景图像中提取绿地覆盖率或交通密度等语义信息需要复杂的计算机视觉和自然语言处理(NLP)技术(Hu et al., 2019),这超出了传统GIS工具的能力。现有地理空间数据系统的碎片化特性进一步加剧了这些挑战。当前的城市数据平台往往是独立开发的,导致数据孤岛现象,阻碍了跨领域分析和数据融合(Zou et al., 2025)。例如,交通数据和环境数据通常分别管理,使得难以分析城市交通对空气质量或噪音水平的影响(Rane et al., 2023, Silva and Mendes, 2012)。数据源之间缺乏语义一致性和互操作性,阻碍了有效的数据共享和实时决策。
近年来,地理空间知识图谱(GeoKG)作为一种整合和分析多源地理空间数据的有前景的解决方案应运而生(Wang et al., 2024)。GeoKG通过结合地理空间实体、关系和属性,扩展了传统的知识图谱(KG)框架,实现了复杂的空间推理和动态数据融合(Wang, Li, & Ai, 2024)。一个构建良好的GeoKG可以链接不同的数据类型,解决语义不一致性问题,并提供城市系统的统一表示,从而支持智慧城市规划中的实时决策(Han et al., 2023a)。然而,现有的GeoKG方法主要关注结构化数据和静态关系,在整合文本和图像等非结构化数据方面的能力有限。此外,动态更新和实时推理在当前的GeoKG框架中尚未得到充分探索(Deng et al., 2021)。
为了解决这些挑战,本文提出了一种基于大数据融合的地理空间知识图谱框架(BDF-GeoKG),用于智慧城市规划。该框架整合了矢量、栅格、文本和图像数据,以建立统一的地理空间知识表示,实现动态数据融合、高效查询处理和实时空间推理。BDF-GeoKG的创新之处在于它能够系统地将四种异构数据类型整合到一个统一的语义框架中。与仅关注有限数据类型的先前方法不同,它支持跨模态实体对齐,并为智慧城市应用提供复杂的空间推理。该框架首先从多源数据中提取实体,构建它们之间的空间和语义关系,为图谱分配详细属性,并使用基于道路的策略对不同数据层中的实体进行对齐,以确保一致性。构建的知识图谱存储在Neo4j中,并通过Cypher查询支持动态更新和实时分析。本工作的主要贡献如下:
- •
一个整合了矢量、栅格、文本和图像数据的多源地理空间大数据融合框架。
- •
基于道路对齐的实体对齐策略,以提高数据一致性。
- •
在Neo4j中实现的基于图的数据模型,支持动态查询和实时分析。
- •
实验验证表明该框架在城市热岛分析、交通流量监测、旅行建议和土地利用变化检测方面的有效性。
本文的结构如下。第2节回顾了地理空间知识图谱和智慧城市规划的相关工作,指出了现有方法在处理多源数据整合和实时推理方面的局限性。第3节定义了研究中使用的关键术语和概念,为所提出的框架提供了理论基础。第4节介绍了BDF-GeoKG框架,详细说明了实体提取、关系构建、属性提取和实体对齐的过程。第5节描述了实验设置和结果,展示了该框架在各种智慧城市规划场景中的有效性。第6节总结了研究贡献,讨论了研究的局限性,并概述了潜在的未来研究方向。