基于大数据融合的地理空间知识图谱构建方法,用于可持续发展的智慧城市

《Sustainable Cities and Society》:Big data fusion-driven geospatial knowledge graph construction method for sustainable smart cities

【字体: 时间:2025年12月28日 来源:Sustainable Cities and Society 12

编辑推荐:

  多源地理空间数据融合驱动的知识图谱框架(BDF-GeoKG)提出基于矢量、栅格、文本及图像数据的整合方法,通过实体提取、关系构建、属性关联及道路基准对齐实现动态知识图谱构建,在武汉城市热岛分析、交通监测等场景验证其效率提升40%及多模态数据融合能力。

  
段玉曦|梁茂涵|李岩|高若斌|陈进|陈中硕|王华
中国武汉大学测绘与遥感信息工程国家重点实验室

摘要

由于空间分辨率的不一致性、数据延迟和处理效率低下,城市规划在整合和分析多源地理空间数据方面面临着日益增长的挑战。传统的地理信息系统(GIS)和遥感模型通常依赖于单一数据源,这限制了它们为智慧城市发展提供准确和全面见解的能力。本文提出了一种基于大数据融合的地理空间知识图谱框架(BDF-GeoKG),通过整合矢量、栅格、文本和图像数据来应对这些限制。该框架遵循一个结构化的流程,包括实体提取、关系构建、属性提取和实体对齐,以建立一个统一的地理空间知识图谱。实体提取从多源数据中识别地理对象和属性;关系构建定义实体之间的空间和语义连接;属性提取为实体分配详细的属性,包括空间、环境和文本属性;实体对齐使用基于道路的对齐策略来确保不同数据源之间的一致性。基于图的数据模型使用Neo4j实现,以支持多模态数据的高效存储、查询和分析。使用武汉的真实世界数据进行实验验证,证明了该框架在城市热岛分析、交通流量监测、旅行建议和土地利用变化检测方面的有效性。结果突显了该框架在增强数据整合、支持动态城市分析和为可持续智慧城市规划提供智能决策支持方面的潜力。与传统的GIS工作流程相比,BDF-GeoKG在保持分析准确性的同时,将查询响应时间减少了40%以上,并降低了非专业用户的技术门槛。

引言

随着城市化的快速推进和城市系统复杂性的增加,智慧城市规划在整合和分析多源地理空间数据方面面临着日益增长的挑战(Tang & Waters, 2005)。根据联合国的数据(Huang et al., 2019),预计到2050年,全球超过68%的人口将居住在城市地区,导致城市复杂性和基础设施需求的激增。这种快速的城市化伴随着来自多种来源的地理空间数据量的增加,包括遥感(Bunting et al., 2014)、地理信息系统(GIS)(Shaw & Xin, 2003)、卫星图像(Feizizadeh et al., 2021, Sarvestani et al., 2011)、社交媒体(Shao et al., 2021)和传感器网络(Yu & Fang, 2023)。有效整合和分析这些异构数据对于提高城市韧性、优化基础设施和改善智慧城市环境中的公共服务至关重要(Marzouk and Othman, 2020, Vinasco-Alvarez et al., 2024)。
传统的GIS和遥感方法已被广泛用于城市空间分析,但在处理大规模、多源数据时存在显著局限性(Gao et al., 2022)。传统的GIS平台主要依赖矢量和栅格数据进行空间分析,但难以整合来自社交媒体和传感器网络等动态来源的实时信息(Alam et al., 2022)。此外,数据格式、空间分辨率和时间频率的差异导致了数据整合和分析的复杂性(Crooks & Wise, 2013)。例如,表示道路网络(Jiang et al., 2022)和土地地块的矢量数据可能具有较高的空间精度,但时间分辨率较低,而基于卫星的栅格数据可能更新频繁,但空间分辨率较低(Xia et al., 2022)。这种数据特性的不匹配使得构建适用于智慧城市规划决策的统一地理空间表示变得困难。此外,来自社交媒体和街景图像等非结构化数据的日益增加也带来了额外的挑战(Tang et al., 2021)。现有的GIS和遥感系统主要设计用于处理结构化数据,限制了它们从非结构化或半结构化数据源中提取有意义见解的能力(Singh, 2019, Wilkinson, 1996)。例如,从街景图像中提取绿地覆盖率或交通密度等语义信息需要复杂的计算机视觉和自然语言处理(NLP)技术(Hu et al., 2019),这超出了传统GIS工具的能力。现有地理空间数据系统的碎片化特性进一步加剧了这些挑战。当前的城市数据平台往往是独立开发的,导致数据孤岛现象,阻碍了跨领域分析和数据融合(Zou et al., 2025)。例如,交通数据和环境数据通常分别管理,使得难以分析城市交通对空气质量或噪音水平的影响(Rane et al., 2023, Silva and Mendes, 2012)。数据源之间缺乏语义一致性和互操作性,阻碍了有效的数据共享和实时决策。
近年来,地理空间知识图谱(GeoKG)作为一种整合和分析多源地理空间数据的有前景的解决方案应运而生(Wang et al., 2024)。GeoKG通过结合地理空间实体、关系和属性,扩展了传统的知识图谱(KG)框架,实现了复杂的空间推理和动态数据融合(Wang, Li, & Ai, 2024)。一个构建良好的GeoKG可以链接不同的数据类型,解决语义不一致性问题,并提供城市系统的统一表示,从而支持智慧城市规划中的实时决策(Han et al., 2023a)。然而,现有的GeoKG方法主要关注结构化数据和静态关系,在整合文本和图像等非结构化数据方面的能力有限。此外,动态更新和实时推理在当前的GeoKG框架中尚未得到充分探索(Deng et al., 2021)。
为了解决这些挑战,本文提出了一种基于大数据融合的地理空间知识图谱框架(BDF-GeoKG),用于智慧城市规划。该框架整合了矢量、栅格、文本和图像数据,以建立统一的地理空间知识表示,实现动态数据融合、高效查询处理和实时空间推理。BDF-GeoKG的创新之处在于它能够系统地将四种异构数据类型整合到一个统一的语义框架中。与仅关注有限数据类型的先前方法不同,它支持跨模态实体对齐,并为智慧城市应用提供复杂的空间推理。该框架首先从多源数据中提取实体,构建它们之间的空间和语义关系,为图谱分配详细属性,并使用基于道路的策略对不同数据层中的实体进行对齐,以确保一致性。构建的知识图谱存储在Neo4j中,并通过Cypher查询支持动态更新和实时分析。本工作的主要贡献如下:
  • 一个整合了矢量、栅格、文本和图像数据的多源地理空间大数据融合框架。
  • 基于道路对齐的实体对齐策略,以提高数据一致性。
  • 在Neo4j中实现的基于图的数据模型,支持动态查询和实时分析。
  • 实验验证表明该框架在城市热岛分析、交通流量监测、旅行建议和土地利用变化检测方面的有效性。
本文的结构如下。第2节回顾了地理空间知识图谱和智慧城市规划的相关工作,指出了现有方法在处理多源数据整合和实时推理方面的局限性。第3节定义了研究中使用的关键术语和概念,为所提出的框架提供了理论基础。第4节介绍了BDF-GeoKG框架,详细说明了实体提取、关系构建、属性提取和实体对齐的过程。第5节描述了实验设置和结果,展示了该框架在各种智慧城市规划场景中的有效性。第6节总结了研究贡献,讨论了研究的局限性,并概述了潜在的未来研究方向。

相关研究

相关工作

近年来,大数据与GeoKG的整合已成为可持续智慧城市发展中的关键研究前沿。GeoKG提供了一种结构化且语义丰富的表示空间实体及其关系的方式,实现了高级的空间推理和决策。然而,随着城市数据来源的日益多样化——从结构化的矢量数据到非结构化的文本和图像——如何有效地将这些异构数据类型融合在一起

定义

构建基于大数据融合的地理空间知识图谱需要对其基础概念和计算方法进行精确定义。本节介绍了与知识表示和地理空间语义相关的关键定义。

定义3.1.1

知识图谱(KG)

知识图谱(KG)是对现实世界知识的结构化表示,由实体、关系和属性组成。它通常使用如下三元组结构:(E,R,E),其中(E,R,A)E表示一个实体,R

地理空间知识图谱构建

所提出的构建基于大数据融合的地理空间知识图谱(BDF-GeoKG)的框架包括四个主要组成部分:实体提取、关系构建、属性提取和实体对齐。该框架整合了四种类型的数据——矢量、栅格、文本和图像数据——以构建统一的地理空间表示,如图4所示。在实体提取阶段,从多源数据中识别地理实体和属性。

实验与结果

本节通过多个案例研究展示了BDF-GeoKG的构建结果和验证。首先,我们介绍了构建的BDF-GeoKG,包括整合的多源数据以及矢量、栅格、文本和图像层中对齐的实体。构建的知识图谱使用Neo4j图数据库实现,该数据库支持大规模地理空间数据的高效存储、查询和分析。

讨论

所提出的BDF-GeoKG框架为可持续智慧城市规划提供了强大的工具,通过整合、分析和可视化多源地理空间数据来实现这一目标。能够在统一的知识图中处理矢量、栅格、文本和图像数据,增强了动态城市分析和智能决策的能力。通过各种案例研究,BDF-GeoKG展示了其在支持复杂空间推理和促进实际城市

CRediT作者贡献声明

段玉曦:撰写——审阅与编辑、撰写——初稿、可视化、软件开发、概念化。梁茂涵:撰写——审阅与编辑、撰写——初稿、可视化、验证、监督、软件开发、概念化。李岩:撰写——审阅与编辑、撰写——初稿、可视化、方法论、形式化分析。高若斌:撰写——审阅与编辑、撰写——初稿、监督、方法论。陈进:撰写——审阅与编辑

未引用的参考文献

表7、表9、表10、表11、表12、表13

利益冲突声明

本手稿尚未在其他地方部分或全部发表,也未被其他期刊考虑。我们已阅读并理解了您期刊的政策,相信该手稿或研究没有违反任何这些政策。不存在需要声明的利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号