基于大语言模型多智能体系统(WALMAS)的空间多准则决策权重分配方法及其在垃圾填埋场选址中的应用

【字体: 时间:2025年09月13日 来源:Geomatica CS1.2

编辑推荐:

  本研究针对空间多准则决策(SMCDM)中专家权重分配存在主观偏见、资源消耗大及难以达成共识等问题,提出了一种基于大语言模型(LLMs)和多智能体系统(MAS)的权重分配方法(WALMAS)。该方法利用GPT-4o、Gemini和Copilot等LLMs模拟不同领域专家,通过四分位距(IQR)去噪和Kendall's W共识算法实现高效可靠的权重收敛。案例研究表明,WALMAS在垃圾填埋场选址中能有效替代传统专家加权,提升决策效率与一致性,为GeoAI辅助决策提供了创新范式。

  

在复杂的空间规划问题中,如基础设施开发、环境影响评估和土地利用优化,空间多准则决策(Spatial Multi-Criteria Decision-Making, SMCDM)方法已成为关键工具。其中,准则权重的分配通常通过专家评估执行,这是这些方法论的核心环节。传统加权方法包括直接评分、配对比较、点分配和排序法等,尽管直接加权简单直观,但容易受到人类偏见的影响;配对比较虽能评估相对重要性,但过程繁琐;点分配和排序法也各具特点,但都面临主观性强、资源密集和达成共识困难等挑战。近年来,虽然出现了结合模糊逻辑、灰色理论等处理不确定性的新方法,如模糊AHP(Analytic Hierarchy Process)、模糊SWARA-BWM(Step-Wise Weight Assessment Ratio Analysis-Best Worst Method)等,但群体决策中的偏见、耗时和协调难题依然突出。特别是在涉及不同利益群体的冲突时,群体加权方法在空间多准则决策中虽被提出,但协同多准则空间决策分析(Collaborative Multi-Criteria Spatial Decision Analysis, CMSDA)仍面临显著障碍,包括专家主观偏见、资源消耗大以及意见分歧时难以达成共识等问题。这些限制催生了对人工智能替代方案的需求,尤其是大语言模型(Large Language Models, LLMs)如GPT-4o、Gemini和Copilot的出现,为模拟专家推理和聚合多样视角提供了新途径。多智能体系统(Multi-Agent Systems, MAS)则能通过协作过程促进权重操作并达成共识,从而有望解决传统方法的痛点。

为了探索LLMs和MAS在替代或增强专家加权方面的潜力,Mohammad H. Vahidnia在《Geomatica》上发表了这项研究,聚焦于方法整合、优势与限制,并以垃圾填埋场选址中的准则加权作为案例验证。研究采用了Weight Assignment by LLM-based MAS(WALMAS)方法,主要技术方法包括:首先,利用多种LLMs(OpenAI GPT-4o、Google Gemini和Microsoft Copilot)作为初级代理,模拟不同领域专家(如环境、城市规划、地理和社会专家)生成初始权重;其次,通过解析和提取LLMs响应中的数值权重,使用标准定性量表(如低重要性到极端重要性对应1-9分)进行直接加权;然后,应用两层算法处理权重,第一层使用四分位距(Interquartile Range, IQR)方法去除异常值,第二层基于Kendall's W指数进行迭代协商和共识达成;最后,在GeoAI框架下,通过多智能体协商过程实现权重收敛,并使用Python程序实现算法,数据公开于GitHub仓库。案例涉及9个准则,包括地形、地质、含水层和地表水等,通过敏感度分析和人类专家满意度评估验证方法的有效性。

研究结果部分从多个方面展示了WALMAS方法的性能。在初始权重获取分析中,热图显示不同LLMs代理为特定准则生成了可比较的权重,GPT-4o、Gemini和Copilot均表现出高度一致性,但权重模式存在差异:GPT-4o赋予监管合规性(Regulatory Compliance)和定居点与城市中心(Settlements and Urban Centers)较高权重(均值分别为7.76和7.63),而气候和天气条件(Climate and Weather Conditions)和坡度(Slope)权重较低;Gemini则显示更均匀的权重分配,但所有标准差相同(0.50),可能反映其输出的同质性;Copilot对定居点与城市中心赋予最高权重(8.49)。总体而言,Copilot倾向于分配较高权重,Gemini较低,GPT-4o居中,平均标准差分别为0.3345、0.4398和0.3903,表明权重集中度高,分散度小。在MAS共识达成结果中,Python程序实现了权重加载、异常值去除和聚合,迭代协商过程基于Kendall's W收敛,设置最大迭代100次、学习率α为0.5、收敛阈值ε为1e-4。密度图显示IQR方法有效减少了权重变异性,使分布更平滑;迭代图显示共识在4次迭代后基本达成,例如对于监管合规性等准则,专家组权重通过调整率向全局均值靠拢,最终实现Kendall's W接近1的完全一致。收敛权重的优先顺序为:监管合规性(7.56)、定居点与城市中心(7.11)、城市发展和基础设施位置(6.80)、生态敏感性(6.28)、坡度(5.88)、气候和天气条件(5.09)、含水层和地表水(4.90)、地质(4.40)和地形(4.02)。敏感度分析表明,学习率α低于0.7时收敛概率高,而专家组移除分析显示环境与自然资源(NER)组对地形、坡度等准则权重影响显著,其移除会导致权重平衡变化大;人类专家满意度调查显示,83%的专家同意准则优先顺序,86%认为AI适合参与加权,70%会选择相同权重,证实了方法的可接受性。在权重应用示例中,伊朗Mazandaran省的垃圾填埋场适宜性地图生成中,使用加权和算子应用最终权重,结果显示东部和西北部区域适宜性高,验证了WALMAS在实际空间决策中的可行性。

研究结论强调,WALMAS方法通过LLMs和MAS的结合,有效缓解了SMCDM中的偏见和资源问题,其优势包括:生成大量权重案例(如240个权重 per criterion),减少主观性;权重分散度低(标准差仅占范围4.18%),提升稳定性;可扩展至复杂问题,适应多样专家视角;并通过IQR去噪和Kendall's W共识算法,主动推动权重收敛,优于简单平均或聚类方法。敏感度分析还揭示了特定专家组(如NER)的关键作用,为决策优化提供了 insights。然而,挑战包括LLMs的黑箱特性导致可解释性不足、权重可能缺乏空间上下文敏感性、以及依赖软件代理可能引入训练数据偏见。未来方向包括开发混合框架结合人类专家、探索替代共识度量如Spearman相关或贝叶斯模型、以及引入模糊值处理不确定性。总之,这项研究为GeoAI辅助决策提供了创新工具,通过WALMAS方法实现了高效、一致的权重分配,在垃圾填埋场选址等应用中展现出巨大潜力,为空间规划领域的自动化和智能化奠定了坚实基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号