综述:地理空间数据的表征学习

【字体: 时间:2025年09月23日 来源:Annals of GIS 3.3

编辑推荐:

  本综述深入探讨了生成式人工智能(AI)驱动下自主地理信息系统(Autonomous GIS)的范式变革。文章系统阐述了其五大自主目标(自生成、自执行、自验证、自组织、自成长)、五个自治等级(从流程感知到知识感知)及三大应用规模(本地、集中式、基础设施级),并展望了其在自动化空间数据分析、建模与制图方面的巨大潜力与挑战(如AI空间知识匮乏、自我成长机制、模型自主创新及社会伦理影响),为GIScience的未来发展指明了方向。

  

引言

地理信息系统(GIS)在过去几十年中迅速发展,增强了地理空间数据的收集、管理、分析和可视化能力。GIS将关于位置的数据(地理数据)与描述性信息(属性数据)相结合,以帮助人们理解空间背景下的模式、关系和趋势。GIS的演进是由连续的科学进步和技术创新浪潮推动的,包括个人计算机、互联网、高性能和云计算以及网络基础设施。同时,GIS和GIScience一直受到其邻近学科如认知科学和计算机科学的影响。新兴的生成式人工智能(AI)是一种可以创建新内容(如文本和图像)的人工智能,通过从大量现有数据中学习而成。它已引起全社会和科学界的极大关注,并在图像创建、推理、写作以及编程等多个领域得到研究。在生成式AI的驱动下,研究正朝着自主GIS(Autonomous GIS)的愿景迈进,将其作为由AI驱动的下一代GIS,并实现为各种能够胜任地解决地理空间问题的GIS智能体(GIS Agent),以最小或无需人工干预的方式实现自动空间数据收集、分析和可视化。

自主GIS:下一代AI驱动的GIS

生成式AI及其向人工通用智能(AGI)潜在发展的关键影响之一是从可访问性和智能性两个角度实现数字化操作的自动化,从而将GIS演变为自主GIS。本节通过扩展和深化先前关于自动化目标、自治级别和应用规模的讨论,提出了对自主GIS的愿景。

自主GIS的概念框架

自主GIS代表了AI与GIS集成的新兴范式,它不仅仅是一种工具,更成为一个“人工地理空间分析师”或“数字智能体”,它知道如何使用地理空间工具和地理分析,以及使用什么数据来解决地理空间问题。在此背景下,“智能体”指的是一个能够接收请求、感知环境、做出决策、制定计划并采取行动的自主软件实体。自主GIS不应被视作一个特定的系统,而应被视为一个广义的概念和独特的范式,类似于WebGIS和Cloud GIS。与传统GIS系统相比,自主GIS旨在提高可访问性,力求为更广泛的受众普及空间分析和地理空间技术。

我们设想自主GIS应被设计为一个以编程和数据为中心的框架,能够自动化编码以解决地理空间问题。该框架可以被实现为各种“自主GIS智能体”,这些智能体可以单独或协作工作。这些智能体协助并自动化各种空间任务,例如准备数据、设计地理处理工作流、执行空间分析、进行预测建模、提取见解、创建地图、评估结果、调整工作流、生成报告和提出建议。一个自主GIS智能体无需全能且用途广泛;它可以专注于特定任务,例如数据收集或制图,并构建在现有的GIS组件之上。专门的智能体可以像人类团队一样协作完成复杂任务。我们将这些GIS智能体视为自主GIS的构建模块。从这个意义上讲,自主GIS也可以被称为“智能体GIS”(Agentic GIS)。

从用户的角度来看,GIS智能体是用户与自主GIS系统交互的主要界面。例如,用户可能会问:“恶劣天气事件如何影响美国交通事故的频率和分布?”GIS智能体将收集公开可用的天气和交通事故数据,测试多个模型以探索其关系,并根据其对建模结果的审查来调整模型参数。通过比较和综合多个模型的结果,GIS智能体生成可靠且可重复的结论,并向用户提交一份包含地图、图表、结果描述、解释和建议的报告。此外,自主GIS还可以为物理世界中的机器人提供支持,这些机器人被设计用于在各种变化的物理环境中进行测绘和导航,例如自动驾驶汽车、真空机器人和无人机。

从实现的角度来看,自主GIS包含五个关键功能,包括决策制定、数据准备、数据操作、内存处理和核心更新。决策制定功能生成地理处理工作流并管理任务。数据准备功能确保系统自主收集和选择地理空间数据,解决数据覆盖范围、质量以及符合法规方面的不确定性。数据操作功能处理空间数据处理任务,例如转换和可视化,并具有内置的错误管理功能。内存处理功能记录工作流、结果和新知识,以支持未来使用和改进。核心更新功能通过利用过去的成功和失败对AI核心进行微调来实现自我学习,确保持续改进。这些功能由AI和预定义策略提供支持,使自主GIS能够以最少的人工干预执行任务,适应新的挑战,并随着时间的推移完善其能力。并非每个自主GIS的实现或智能体都必须实现所有这些功能,因为用户的需求各不相同。例如,具有决策制定和数据操作功能的智能体可以服务于大多数简单的多步骤空间分析,例如基于提供的数字高程模型(DEM)和研究区域边界生成流域。

自主GIS的目标

我们设想自主GIS应从系统行为的角度实现五个自主目标:自生成、自执行、自验证、自组织和自成长。请注意,这些目标是定性和描述性的,强调自主GIS的功能特性而非严格的技术规范。

自生成涉及创建假设、研究想法、地理处理工作流、代码和见解。对于数据操作任务,自主GIS应能够生成数据处理工作流和相应的程序。可以利用外部GIS库和函数(如GeoPandas、ArcPy、PySAL和Rasterio)来生成地理处理代码。关于研究或建模任务,我们希望自主GIS能够生成创新想法,为地理空间问题提供可行、新颖或具有成本效益的解决方案。一旦研究假设和想法确立,自主GIS应生成地理处理工作流和代码来测试或验证它们。这些工作流构成了空间分析的基础,基于代码的脚本或程序作为其实际实现。先前的研究表明,当前最先进的LLM可以解释用自然语言表达的数据处理和研究任务,并将其转换为工作流和可执行代码。除了生成工作流和代码之外,关键的下一个步骤是从结果中得出有意义的见解。尽管在利用LLM进行GIS报告编写方面有一些早期尝试,但我们认为有效的报告依赖于对结果的准确和合理解释,这一领域在很大程度上仍未被探索。此外,许多多模态LLM能够处理视觉信息,这尤其有价值,因为地理可视化对于人类生成见解至关重要。我们相信自生成目标既实用又可实现,并且应作为开发自主GIS的基础步骤优先考虑。

自主GIS应能够行动,实现自执行的目标。这包括准备数据、执行地理处理工作流,并最终使用现有或新生成的工具以及可用资源将地理数据转换为包含数字、表格或地图的结果。为实现此目标,需要一个具有足够文档的适当硬件和软件环境来执行给定任务的解决方案。Python是一个常用的环境,系统在Python运行时中执行生成的代码以从存储中访问数据、处理数据并产生结果。另一种自执行方法涉及模拟计算机使用,其中智能体通过基于屏幕的交互操作GIS软件,例如ArcGIS(商业GIS)或QGIS(开源GIS)。尽管仍处于早期阶段,但这种方法类似于地理空间分析师的行为,允许智能体直接使用大量现有的地理空间工具,例如最短路径搜索或数据库管理。在这种情况下,仍然需要后端的地理处理工作流来指导智能体的操作,但不是编写代码,而是通过使用GIS图形用户界面来表达工作流。

自验证的目标要求系统验证其行动的结果,包括每个步骤的数据操作和最终输出,确保每个操作按预期执行。例如,系统应确认加载的数据是否准确,空间连接是否成功,以及聚合结果是否合理。实现此目标涉及几个关键组成部分,包括1)地理处理工作流审查:检查生成的工作流在任务上下文和数据条件下是否合理;以及2)步骤验证:检查每个步骤的结果以确保其有效性,并减轻地理处理工作流中的不确定性传播。逐步验证至关重要,因为结果的准确性依赖于每个中间步骤的正确性。这引发了关键问题:什么是“正确性”?应该对属性、表格、图像和可视化应用什么标准?结果在什么准确度水平上可以被接受?如果将错误的结果传递到下一步,可能会产生什么后果?考虑到不同的数据模态、来源、质量和任务上下文,我们认为实现自验证目标的一项关键任务是定义清晰且实用的标准来解决不确定性。需要注意的是,这里讨论的验证指的是数据操作的正确性和合理性,而不是它们与地面实况的一致性。

我们还期望自主GIS能够自组织。像人类和其他系统一样,智能体可能拥有有限的解决问题的资源,并且可以通过仔细管理和组织这些资源而受益。系统应知道如何分配资源和行动以有效处理任务,包括时间、计算能力、内存和与用户的通信。例如,当没有足够的资源来完成分配的任务时,它将通知用户。它还应该标记成功和失败的尝试,以积累经验并避免未来重蹈覆辙。这些实际约束需要强大的项目管理技能。因此,一种自主GIS智能体可以扮演合格的项目经理角色,能够组织资源、协调行动并与其他专门的GIS智能体协作以组织“团队”来处理复杂任务。这样的智能体还需要认识到何时向人类用户请求额外上下文或进行协作以澄清目标、解决问题或产生新想法。总的来说,自组织的目标反映了系统管理外部资源和内部生成输出的能力,确保任务高效且有效地完成。考虑到可能非常高的资源需求,这也意味着GIS智能体应该能够预测其足迹,例如在利用的能源、碳排放和AI可持续性的其他方面。

期望自主GIS通过从过去的任务(包括成功和失败的尝试)以及外部文档中持续学习来实现自我成长。这意味着它应该能够通过总结其行动背后的一般规则和推理,识别所需的知识或技能,并更新其策略来改进未来的空间分析和建模。在五个目标中,自我成长是最难实现的。它要求系统随着时间的推移提高任务效率,通过提高速度、增加准确性或减少资源利用率来实现。它还需要调整其能力以满足用户和组织不断变化的使命。最近的研究强调,即使是最先进的生成式AI模型,如GPT-4o,由于缺乏背景知识或特定领域的技能(例如处理地图投影或执行空间连接操作),仍然在空间编程任务中挣扎。

想象一下,生成式AI模型就像一个刚毕业的大学生,需要通过持续应用来学习必要的知识和技能。几年后,这个人成为其组织中有经验的贡献者。目前,大多数AI模型无法积累经验;它们就像新员工一样每天来到工作岗位,完成一些任务而没有任何改进。生成式AI模型的能力在创建后停滞不前,解决这些弱点仍然是一个重大挑战,需要诸如检索增强生成(RAG)和知识图谱等技术。我们鼓励地理空间社区探索使自主GIS智能体能够自我成长并将外部知识库纳入其过程的方法。潜在的方法包括使用诸如低秩适应(LoRA)等技术对模型进行微调,这有助于系统随时间适应和改进其能力;它在模型中添加小的、可训练的层,允许高效适应而无需改变原始模型的核心权重。

自主GIS的级别

很自然地为自主GIS定义增量级别,其灵感来自自动驾驶汽车的级别和自动化社区。我们将自主GIS分为五个级别,从1级到5级,其中0级指的是没有自动化,人类需要手动在GIS中执行所有数据处理和分析。请注意,本文专注于技术自主性,其中人工干预指的是技术支持或纠正,而不是补充或澄清上下文或任务要求。除了技术执行之外,人类用户通过评估、接受或拒绝自主GIS产生的结果来扮演主导角色。

1级是流程感知GIS,它可以执行手动定义的地理处理工作流,例如ArcGIS Model Builder和QGIS Model Designer。2级是工作流感知GIS,它可以根据给定的数据和预期结果自主生成工作流以完成空间任务,包括为特定分析实施选定的模型。3级是数据感知GIS,它强调根据人类和智能体提供的任务选择现有数据集或在需要时收集新数据的能力。4级是结果感知GIS,它强调理解结果并相应地改进工作流和数据使用的能力,且人工干预有限。最后,5级代表知识感知GIS,这是一个完全自主的系统,能够在没有人类技术监督的情况下执行空间分析。它通过从成功和失败的经验中学习来制定通用规则、完善策略并改进地理处理工作流,从而实现自我成长的目标。

0级:手动GIS(无自动化)

手动GIS代表一个完全手动的系统,所有GIS任务,包括数据收集、分析和可视化,都由用户使用GIS手动确定和执行,没有任何自动化(除了模型构建器、脚本编写和批处理操作等情况)。系统只提供数据操作和可视化工具,要求用户处理每个方面,包括识别和纠正错误。例如,分析师使用GIS手动导入人口普查数据和边界文件,计算人口密度,并将它们叠加在地图上以创建热图。

1级:流程感知GIS(流程自动化,人类驱动)

流程感知GIS引入了针对预定义重复任务的基本流程自动化,例如数据导入、转换以及空间功能(如缓冲或裁剪)。用户定义工作流和参数后,系统自动化其执行,例如数据批处理。它还处理基本错误,尽管复杂的纠正仍然需要人工干预。例如,系统可以自动加载和重新投影城市道路网络的shapefile,并将其裁剪到特定边界,用户使用诸如ArcGIS Model Builder或Python等编程语言设置地理处理工作流。人类使用流程感知GIS驱动分析。

2级:工作流感知GIS(工作流生成,人类辅助)

在此级别,AI可能开始发挥重要作用,将自动化扩展到为给定任务生成和执行地理处理工作流,使传统GIS系统成为工作流感知GIS。它可以根据用户(人类或智能体)准备的数据选择和应用适当的GIS工具和模型来解决地理现象。然而,人工参与对于提供输入、解释结果和管理数据相关问题(如数据缺失和数据不一致)仍然至关重要,因为该级别对意外执行挑战的适应性有限。例如,工作流感知GIS可能自主创建用于使用地形和卫星数据绘制洪水易发区域的地理处理工作流,执行水文模型,并生成洪水风险图,人类根据需要监督或改进过程。

3级:数据感知GIS(数据准备自动化,人类监督)

数据感知GIS集成了数据选择和上下文理解,根据人类和智能体提供的任务自动化数据收集和准备。它代表了自主处理数据准备中不确定性的能力,而不是作为地理处理工作流或工作流感知GIS的先决条件。系统能够识别空间数据类型的适用性和缺点,处理不一致性(如缺失值和不完整覆盖),并调整分类方法以适应不同的时空分辨率。人类仍然需要监督系统,指导数据选择和使用。例如,在绘制绿地地图时,系统可以识别卫星图像分辨率的变化,应用适当的分类技术,并标记低质量数据以供审查。人类分析师应确保数据、建模、结果和结果解释是合理的。

4级:结果感知GIS(结果解释,最小监督)

结果感知GIS引入了基于结果评估的优化,允许系统调整工作流、模型和数据使用以改进结果。决策核心理解输入、模型和输出之间的潜在因果关系,因此它可以改变输入和建模以实现期望的输出。结果感知GIS可以进行迭代建模,因为大多数建模过程都是迭代的。系统可以调整数据、模型、模型参数和工作流以产生优化结果。人工参与可能变得最小,主要限于监督。例如,在预测交通拥堵时,系统使用实时传感器数据自主优化工作流;当意识到预测建模花费太多时间时,它会丢弃不太关键的传感器以提高处理速度。

5级:知识感知GIS(自我成长,无技术监督)

知识感知GIS代表一个完全自主的系统,能够从先前的任务和外部资源中学习,以在没有人类技术指导的情况下改进其未来性能。像人类一样,它可以从实践中积累经验。在这个意义上,5级也可以被称为经验感知GIS。试错过程是关键;它能够识别和总结成功和失败任务背后的基本原理的一般规则和知识。它还可以不仅基于学习的规则和知识更新其决策核心,还可以基于外部文档更新。它独立进行预测性或解释性分析,不断提高其速度和准确性。例如,系统自主分析历史气候数据和实时天气模式以预测未来洪水风险。它测试多个模型和各种数据输入,评估结果,并产生合理的结果。通过这个过程,系统学习了各种模型和数据集的适用性,使其未来能够为类似的洪水预测应用最有效的策略。

重要的是要注意,尽管5级系统在没有技术监督的情况下运行,人类仍然扮演着核心角色。他们仍然负责分配任务、解释并根据系统生成的结果采取行动,并确保符合伦理、社会和政策考虑。例如,虽然系统自主分析历史气候数据和实时天气模式以预测未来洪水风险,但人类专家最终决定调查哪些洪水情景,确定如何沟通风险,并根据系统的输出协调任何缓解行动。

不确定性和自治级别

我们通过考虑智能体处理不确定性的能力来定义自治级别。我们期望自主GIS智能体能够做出合理的决策并处理未见情况,这是处理不确定性的核心方面。空间分析在数据准备、地理处理工作流构建和结果评估的各个阶段涉及各种级别的不确定性。工作流(不包括数据准备)的不确定性在这三个阶段中是最小的。它就像一个“蓝图”,其模式是高度结构化的,通常表示为有向无环图,源节点作为输入数据,汇节点作为最终输出。工作流中的基本操作是明确定义的,例如缓冲和裁剪,并由成熟的包(如GeoPandas和QGIS工具)提供。因此,2级自治(其中地理处理工作流由LLM生成)已经在诸如LLM-Geo等研究中得到证明。

数据准备面临更高的不确定性。出现的问题诸如:应该使用什么样的数据?在哪里可以找到它?私有可用数据是否优于公开可用数据?如何考虑成本与预期结果之间的权衡?它是否充分覆盖研究区域?智能体能否处理大型数据集?遥感影像的质量如何影响项目?属性表中的缩写是什么意思?应如何处理缺失值和错误数据?这些数据准备挑战,涵盖了领域的什么、如何以及为什么,是众多且复杂的。3级自主GIS能够通过以最少的人工协助准备数据来处理这些不确定性。它可以识别和访问最合适的数据,同时做出必要的妥协。

在4级,结果感知GIS根据期望评估结果,识别差距,并调整工作流、数据源或模型以缩小这些差距。结果是否令人满意?差距是什么?如何改变数据源和模型以缩小差距?此外,生成式AI输出的随机性可能会带来进一步的不确定性,因为来自同一模型的同一输入的尝试结果会有所不同,并且由于训练数据和模型架构的偏差可能会增加。此级别的挑战包括正确评估结果以及预测来自调整工作流或数据源的改进。为了解决这个问题,自主GIS智能体必须处理输入、模型、结果之间关联的不确定性以及更广泛的模糊性。

5级,知识感知GIS,期望在没有人类技术监督的情况下运行空间分析,并从实践中积累经验。像人类分析师一样,他们从过去的尝试中学习,总结一般规则,并将他们的知识更有效地应用于类似任务,知识感知GIS使用过去的经验来更好地处理未来任务中的不确定性。随着其知识和经验的增长,与任务相关的不确定性将逐渐被积累的策略减少,系统将变得越来越自主,最终达到完全自治。如前所述,完全自治并不意味着消除自主GIS与人类之间的通信。系统仍然需要从用户那里收集任务上下文以减少不确定性,例如当任务描述中未指定此类信息时,人行道 renovation 项目提案的预算或资源限制。知识感知级别强调实现自我成长目标的特定途径:通过过去的实践、经验和其他外部文档进行学习。我们相信,迭代的、试错的学习处理是推动自主GIS发挥其最大潜力的基础。

自主GIS的规模

为了处理复杂任务,自主GIS必须拥有足够的复杂性

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号