一种基于大型语言模型的方法,用于构建总体规划的知识图谱:以中国广州为例的案例研究

《Land Use Policy》:A large language model-based approach to building the knowledge graph for master plan: A case study in Guangzhou, China

【字体: 时间:2025年10月18日 来源:Land Use Policy 5.9

编辑推荐:

  城市总体规划文本知识图谱构建方法研究,提出基于大语言模型(LLM)的四阶段自动化构建流程,包括实体关系抽取、知识三元组评估、属性标注等任务,通过设计统一提示模板指导Qwen-Max、GPT-4o等四类LLM完成中文规划文本解析,在广州2035年总体规划案例中构建包含7700节点和2万边的关系图谱,有效提升规划知识可视化与查询效率。

  城市化进程是21世纪全球范围内显著的现象之一,尤其自1950年代以来,其对城市人口增长和土地开发的影响愈发明显。随着城市规模的扩大,如何有效地管理和利用城市规划信息成为一项重要课题。城市规划不仅指导着城市空间的布局,还涉及到资源分配、环境优化以及居民生活质量的提升。然而,城市规划通常以大量冗长且结构松散的文本形式呈现,这给信息的系统理解和实际应用带来了挑战。为了克服这一问题,研究者们开始探索自然语言处理(NLP)技术在城市规划中的应用,旨在将复杂的规划文本转化为更易于理解和操作的知识结构。

知识图谱(Knowledge Graphs, KGs)作为一种语义网络,能够有效整合实体、属性及其关系,为城市规划信息的结构化处理提供了新的思路。传统的知识图谱构建方法依赖于特定任务的数据集进行(半)监督训练,这种方法虽然在某些领域取得了成功,但存在高标注成本和较差的可迁移性问题。近年来,大型语言模型(Large Language Models, LLMs)因其强大的语义理解和生成能力,成为构建知识图谱的新选择。LLMs无需标注数据即可从文本中提取结构化信息,这种能力主要得益于精心设计的提示(prompts)策略。提示不仅是模型与人类可读的指令,更是引导模型准确理解任务需求和生成高质量输出的关键。

本研究提出了一种基于LLMs的城市规划知识图谱构建方法,旨在解决城市规划文本中信息提取与结构化处理的挑战。首先,通过文本预处理将原始规划文本转化为适合LLMs处理的格式。接着,设计了一个包含五个组件的统一提示模板,以约束模型生成的内容,确保信息提取的准确性与一致性。最后,利用四类代表性的LLMs——Qwen-Max、GPT-4o、Doubao-Pro和GLM-4,分别执行命名实体识别(NER)、关系抽取(RE)、三元组评估和属性标注等任务,构建出结构化的知识图谱。

在实验部分,研究团队选取了广州的城市总体规划(2017–2035)作为案例,该规划文本共包含65,464个字符。通过精心设计的提示,LLMs成功提取出超过6600个三元组,构建了一个包含超过7700个节点和20,000条边的知识图谱。这些三元组涵盖了五类规划实体:位置、土地利用、方向、概念和计划行动。其中,Qwen-Max负责实体的识别和提取,而其他三类LLMs则专注于关系的识别,从而形成完整的三元组结构。此外,研究还探讨了不同LLMs在任务执行中的表现差异,分析了它们在城市规划这一特定领域的适用性。

研究结果表明,使用LLMs构建城市规划知识图谱在多个方面具有显著优势。首先,这种方法能够有效降低信息提取的复杂度,使城市规划知识更加直观和易于查询。其次,构建的知识图谱可以作为城市规划与多源数据整合的基础,为解决复杂的决策问题提供支持。例如,在多标准决策分析(Multi-Criteria Decision Analysis, MCDA)场景中,规划知识可以作为关键因素,帮助决策者在考虑多种约束和目标的同时,确保方案与现有规划政策的一致性。此外,知识图谱还能为公众提供更清晰的规划信息,增强其对城市发展的理解与参与。

在实际应用中,研究团队展示了三种案例,以说明规划知识图谱如何提升城市规划的可读性和交互性。这些案例包括:规划文本的可视化展示、规划要素之间的关系分析以及规划知识的查询与检索。通过这些示例,研究证明了规划知识图谱在城市规划信息处理中的实用价值。同时,研究也强调了在中文语境下构建规划知识图谱的特殊性。由于中文规划文本与英文文本在语言结构、术语使用和语义表达上存在差异,因此需要针对中文规划文本进行定制化的提示设计,以提高模型的准确性和一致性。

此外,研究还探讨了中文大型语言模型在城市规划任务中的表现。尽管GPT-4o等国际主流LLMs在多个领域表现出色,但中文LLMs如Qwen-Max、GLM-4和Doubao-Pro也在快速发展,并逐渐展现出与国际模型相当的能力。不同模型在特定任务上的表现各有差异,因此在构建规划知识图谱时,如何选择和组合不同的LLMs以达到最佳效果成为一个重要课题。研究团队通过实验对比了不同模型在规划知识提取任务中的性能,发现合理利用多种模型可以有效平衡成本与效果,提高整体任务的完成质量。

总体而言,本研究为城市规划知识图谱的构建提供了一种全新的方法论,不仅提升了规划信息的结构化水平,也为后续的规划分析和决策支持提供了基础。同时,研究还为中文自然语言处理任务中使用通用LLMs提供了有价值的参考,特别是在如何优化提示设计以适应中文规划文本方面。未来的研究可以进一步探索不同模型之间的协同机制,优化提示模板的结构和内容,以提高知识图谱构建的效率和准确性。此外,还可以将知识图谱与其他数据源进行整合,拓展其在城市规划领域的应用范围,如智能城市治理、城市空间优化和可持续发展评估等。通过这些努力,城市规划知识图谱有望成为城市规划信息管理的重要工具,推动城市规划从传统的文本分析向智能化、数据驱动的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号