
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型的多智能体系统动态集成与自动扩展机制研究
【字体: 大 中 小 】 时间:2025年09月15日 来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
本综述创新性地提出初始自动智能体生成(IAAG)和动态实时智能体生成(DRTAG)两种方法,通过高级提示工程(包括人物模式提示、链式提示和少样本提示)实现大语言模型(LLM)多智能体系统(MAS)的动态扩展。研究采用二元加权、TF-IDF、MTLD和BERTScore?等多维度评估体系,证实DRTAG方法在任务相关内容覆盖度、关键词丰富性、词汇多样性和主题一致性方面显著优于传统静态架构(如AutoGen),为复杂动态环境下的自适应人工智能系统提供了突破性解决方案。
引言:大语言模型驱动的多智能体系统(LLM-based MAS)代表了突破性范式,通过多样化的LLM智能体协作利用独特能力实现共同目标。尽管LLM-based MAS性能超越单个智能体,当前架构仍受限于预定义的固定静态设计,限制了在动态环境中的适应性和可扩展性。
方法学创新:针对这些局限性,本研究提出两种新颖方法:初始自动智能体生成(IAAG)和动态实时智能体生成(DRTAG)。这些方法能够基于演进的对话和任务特定上下文自动创建新智能并无缝集成到MAS中,从而减少人工干预需求。研究方法采用高级提示工程技术,包括人物模式提示(persona pattern prompting)、链式提示(chain prompting)和少样本提示(few-shot prompting),通过现有LLM智能体生成新智能体。同时,研究适配了多种评估指标对LLM生成文本进行评分和排序。
实验结果:实验结果表明,与静态MAS架构相比,DRTAG方法在系统适应性和任务性能方面实现显著提升。IAAG框架也增强了系统初始灵活性,支持创建上下文相关智能体。
相关研究背景:近年来LLM技术革命性发展,如GPT-4和BERT在自然语言处理(NLP)领域展现出卓越性能。LLM具备促进 emergent language(EL)的新兴能力,该领域研究通过交互在人工智能体间发展的通信形式,无需显式预编程。LLM为智能体间和人机通信提供强大基础,可作为AI智能体的"大脑",使其适应各种场景并执行复杂任务。
技术实现细节:研究实现了三种单次定义方法:用户定义智能体集、IAAG和DRTAG。后两种方法引入新型对话管理智能体,采用三种不同算法确定后续参与对话的LLM智能体:基于提示工程的选择、轮询算法和随机选择。用户可选择其中一种选项来控制智能体参与顺序。
评估体系:研究构建包含90个对话的语料库δ,通过医疗场景模拟(右下腹痛患者诊疗)进行综合评估。采用四种互补评估维度:二元加权测量任务相关内容覆盖度;TF-IDF(词频-逆文档频率)评估主题相关关键词丰富度;MTLD(文本词汇多样性测量)评估词汇多样性和丰富度;BERTScore测量主题相关性和一致性。
统计验证结果:Mann-Whitney U检验和Cliff's Delta效应量测量显示,DRTAG与AutoGen比较p值小于0.0001,效应量0.90;IAAG与AutoGen比较p值小于0.0001,效应量0.617;DRTAG与IAAG直接比较p=0.0147,效应量0.328。所有比较均拒绝零假设,提供强统计证据表明两种提出方法在生成任务相关对话内容方面优于传统AutoGen实现。
关键发现:动态生成的智能体通过DRTAG方法比精心挑选的AutoGen智能体覆盖更多任务相关内容。自动生成的IAAG智能体也比精心挑选的AutoGen智能体覆盖更多任务相关内容。智能体数量与任务相关内容覆盖度存在强相关性(相关系数0.75)。词汇多样性分析显示,DRTAG对话比IAAG和AutoGen框架生成的对话具有更高的词汇多样性和丰富度(MTLD分数)。虽然两种新方法在生成主题多样性对话方面都优于传统AutoGen框架,但直接比较显示无显著差异。
技术优势:与需要用户预先选择并精确定义智能体集的现有解决方案(如AutoGen框架)不同,提出的新方法通过预定义对话管理智能体自动生成环境所需的所有必要智能体,成功减轻了对用户领域专业知识的要求。提出的对话管理智能体利用高级提示工程技术(如人物模式提示、链式提示和少样本提示)促进新智能体的动态生成。
应用前景:这些发现凸显了动态LLM-based MAS克服静态架构限制、解决复杂现实挑战的潜力,为跨不同领域的创新应用铺平道路。研究方法为智能和自主LLM-based MAS的未来发展提供了基础,因为这些提出的DRTAG和IAAG方法具有促进与现有系统(如AutoGen和MetaGPT)无缝集成的通用算法。
未来方向:未来工作可在其他医疗场景以及法律、工程、音乐、教育、管理等其他行业相关场景中评估提出方法和现有方法。可结合解释性AI技术为原始LLM提取忠实有效的全局解释,使这些系统更能够自主可靠地处理复杂现实挑战。
生物通微信公众号
知名企业招聘