AI Captain:基于大语言模型的自主水面舰艇对话式任务规划与执行系统

【字体: 时间:2025年06月27日 来源:Ocean Engineering 4.6

编辑推荐:

  针对自主水面舰艇(ASV)高阶任务规划研究不足的问题,研究人员开发了首个基于大语言模型(LLM)的"AI Captain"系统,通过分层架构将LLM推理与低阶控制系统结合,实现了自然语言交互式任务规划与动态重规划。实验证明该系统能处理未预设的应急场景(如遇险呼叫),为海事领域人机协作提供了创新范式。

  

随着全球海事行业加速向自动化转型,自主水面舰艇(ASV)在货物运输、水域勘测等场景的应用日益广泛。然而当前研究多聚焦于感知、避碰等底层技术,高阶任务规划领域存在显著空白。传统规则式规划器难以应对复杂多变的海洋环境,而人工规划效率低下,这成为制约ASV大规模应用的关键瓶颈。与此同时,远程操作中心(ROC)的人机交互效率问题也亟待解决——当船舶自主性提升时,操作员可能因参与度不足导致情境意识下降,无法在系统故障时及时干预。

针对这些挑战,挪威研究团队在《Ocean Engineering》发表了创新性研究成果。他们开发了名为"AI Captain"的对话式任务规划系统,首次将大语言模型(LLM)应用于真实ASV控制。该系统采用分层架构:高层LLM负责自然语言理解与任务分解,通过链式推理(CoT)生成可执行方案;底层则依托传统导航控制系统(GNC)确保操作安全。实验证明,该系统不仅能完成预设货运任务,还能响应未编程的突发事件(如燃油告警、遇险呼叫),并通过标准化海事通信短语(SMCP)实现高效人机对话。

研究团队主要采用三项关键技术:1) 事件驱动架构整合ROS2框架,实现状态监控、LLM推理与执行的闭环控制;2) 基于GPT-4-turbo的CoT提示工程,将模糊指令转化为结构化动作序列;3) 工具调用层设计,通过JSON格式验证确保LLM输出与船舶API的安全对接。实验使用Maritime Robotics开发的Otter USV平台,在挪威某港口实地测试了货运与应急响应场景。

研究结果部分显示:
3.1 事件驱动架构
通过状态节点实时采集GNSS、燃料等数据,触发LLM重规划。如图1所示,系统在收到操作员指令或警报后,依次执行状态快照、推理验证、人工确认等步骤,形成完整控制回路。

4.2 基础货运任务实验
在"从2号码头运送货物X至3号码头"的测试中,系统成功分解出"维修-启航-停靠-装卸"等子任务。当模拟燃油不足时,能自主插入"返回基地加油"的重规划步骤,轨迹数据显示其绕行决策符合海事安全规范。

4.3 应急响应实验
面对操作员报告的遇险信号(北220m/东160m),未经专门训练的LLM展现出类人决策能力:立即暂停货运任务前往救援,并通过自然语言对话协商后续行动。这证明LLM能从预训练知识中提取海事应急协议。

4.4 鲁棒性测试
10组模拟任务显示,GPT-4o完成率100%,平均处理时间1.44秒;而轻量版GPT-4o-mini虽响应更快(0.88秒),但仅能完成最简单任务,凸显模型能力与可靠性的正相关关系。

讨论部分强调了三重意义:技术层面,验证了LLM在非结构化海事决策中的独特价值——相比传统规划器,它能处理训练数据覆盖但未显式编程的场景;安全层面,分层设计将LLM限制在高层规划,通过操作员确认和底层控制确保可靠性;人机交互层面,SMCP通信与"思维链"可视化提升了自动化透明度。

该研究也存在若干局限:仅使用GNSS单一传感器,未整合AIS(船舶自动识别系统)等海事专用数据;当前动作空间限于固定航速移动,未考虑动态环境适应;所有测试由熟悉系统的操作员完成,需进一步开展多用户研究。未来工作将探索视觉语言模型(VLM)增强环境感知,并测试开源模型替代方案。

这项研究为海事自主系统开辟了新路径——不是取代人类判断,而是让操作员能像"舰队指挥官"那样,通过自然语言高效管理多艘ASV。随着LLM能力的持续进化,这种结合语义推理与专业控制的方法,或将成为智能航运时代的关键基础设施。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号