NetIntent:基于大语言模型的端到端意图驱动SDN自动化框架
《IEEE Open Journal of the Communications Society》:NetIntent: Leveraging Large Language Models for End-to-End Intent-Based SDN Automation
【字体:
大
中
小
】
时间:2025年12月11日
来源:IEEE Open Journal of the Communications Society 6.1
编辑推荐:
本研究针对意图驱动网络(IBN)从高层自然语言意图到底层设备配置的全流程自动化挑战,提出了NetIntent框架。该研究通过构建IBNBench测评集系统评估33种开源大语言模型(LLM)在意图翻译和冲突检测任务中的表现,并创新性地将LLMs应用于ODL、ONOS、Ryu和Floodlight四种主流SDN控制器的全生命周期管理。结果表明,特定LLMs在结构化任务中表现优异,NetIntent实现了自然语言意图到可执行配置的端到端转化,为自主化网络运维提供了新范式。
随着数字化转型的深入,网络规模不断扩大,传统网络管理方式已难以满足动态业务需求。软件定义网络(SDN)通过控制面与数据面分离实现了网络可编程性,但实际操作中仍需要专业人员编写底层配置指令。意图驱动网络(IBN)作为SDN的自然演进,允许管理员用自然语言声明业务目标,然而现有方案多依赖刚性规则和固定API,在扩展性和适应性方面存在局限。
当前IBN系统面临三大核心挑战:一是自然语言到设备配置的准确翻译问题,二是多策略并存时的规则冲突检测难题,三是部署后的持续状态保障机制缺失。尽管大语言模型(LLM)在自然语言理解方面展现出强大能力,但其在真实网络环境中的适用性尚未得到系统验证。发表在《IEEE Open Journal of the Communications Society》的这项研究,正是要解决这些关键问题。
为系统评估LLMs在IBN任务中的潜力,研究团队首先构建了IBNBench测评体系,包含八个专门数据集:Intent2Flow-ODL、Intent2Flow-ONOS、Intent2Flow-Ryu、Intent2Flow-Floodlight用于意图翻译任务,FlowConflict-ODL、FlowConflict-ONOS、FlowConflict-Ryu、FlowConflict-Floodlight用于冲突检测任务。这些数据集首次针对行业级SDN控制器提供了自然语言意图与控制器特定流表配置的配对样本。
研究人员对33个开源LLMs进行了全面测评,发现在意图翻译任务中,模型表现与参数规模并非简单正相关。特定模型如QwQ系列(32B)在结构化输出任务中表现出色,而Codestral(22B)在ONOS控制器相关任务中实现了最佳平衡。在冲突检测方面,Gemma2(27B)等模型在保持高精度的同时实现了较低误报率。
基于测评结果,团队提出了NetIntent框架,这是首个支持全意图生命周期的LLM驱动IBN系统。其核心创新在于将LLMs与确定性验证模块有机结合:翻译阶段采用动态上下文示例选择和多模型协作机制,确保生成配置符合控制器规范;激活阶段引入基于规则类型、匹配特异性和优先级的分层冲突解决策略;保障阶段则通过实时流量测试和统计指标分析实现闭环验证。
关键技术方法包括:1)使用最大边际相关性算法动态选择上下文示例;2)设计控制器特定的结构化提示模板;3)构建多LLM协作的故障恢复机制;4)实现基于测试流量生成的意图漂移检测。实验采用Mininet构建钻石型拓扑(四个OpenFlow交换机和四个主机),分别部署ODL、ONOS、Ryu和Floodlight控制器进行验证。
测评显示,LLMs在控制器特定任务中表现差异显著。在ODL流表翻译任务中,QwQ-abliterated(32B)在3个上下文示例下达到100%准确率;ONOS任务中Codestral(22B)表现最佳。值得注意的是,适当增加上下文示例可显著提升中等规模模型的性能,如Codellama(7B)准确率提升达30%,表明提示工程对任务性能的关键影响。
在流规则冲突检测任务中,模型表现出两种典型模式:QwQ系列模型保持高精度(F1-score 0.82-0.97),而部分模型如Mistral(7B)虽实现全召回但产生大量误报。特别在Floodlight控制器任务中,11个模型达到完美精度,证明LLMs在处理结构化对比任务时的潜力。
NetIntent在四个控制器上的部署验证了其通用性。系统平均端到端延迟为20-35秒,虽不适用于毫秒级实时控制,但完全满足策略级网络管理需求。测试案例显示,系统能成功处理"在交换机1上阻断10.0.0.1到10.0.0.4流量"等复杂意图,并自动解决优先级冲突。
与规则式NLP基线(56%准确率)和Bi-LSTM-CRF模型(数据稀缺下无法收敛)相比,NetIntent展现出显著优势。LLMs的预训练知识使其在低数据环境下仍能保持可靠性能,同时通过提示调整即可适应新策略类型,大幅降低系统维护成本。
本研究通过大规模实证分析证实了LLMs在网络自动化领域的应用价值。NetIntent框架的创新在于将LLMs的灵活性与传统网络的确定性要求相结合,实现了从自然语言到网络配置的端到端转化。其提出的测评体系为后续研究提供了基准,而模块化设计使系统能够灵活适配不同网络环境。尽管当前延迟特性限制了其在实时场景的应用,但为未来智能网络运维系统的发展指明了方向,特别是为5G网络切片、云网融合等复杂场景的自动化管理提供了技术基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号