基于本体增强小语言模型的智能家居设备端意图推理框架CIDER
《IEEE Access》:On-Device Intent Reasoning for Smart Home Agents Via Ontology-Augmented sLLMs
【字体:
大
中
小
】
时间:2025年11月27日
来源:IEEE Access 3.6
编辑推荐:
本研究针对基于大语言模型(LLM)的智能家居代理因云端部署引发的隐私、延迟和资源消耗问题,提出了CIDER框架。该框架通过构建本体知识图谱(KG),结合设备常识与用户上下文,增强设备端小语言模型(sLLM)的意图推理能力。在SmartThings平台测试中,CIDER在复杂家居环境下成功率高达76.6%,显著优于现有方案,为资源受限设备提供了可扩展、可解释的本地化推理新路径。
随着现代智能家居进化为包含众多互联设备的复杂物联网生态系统,用户与家居环境的交互方式正从简单的开关指令转向更加自然、模糊的意图表达。想象一下,当你在客厅随口说"这里太热了",一个真正智能的系统不仅需要理解你想降低温度的意图,还要综合考虑室内外温度、设备状态、用户习惯等动态上下文,才能决定是开启空调、调整 thermostat 还是打开窗户。这种场景对传统的智能家居系统构成了巨大挑战。
现有的智能家居系统,如基于触发动作规则(Event-Condition-Action, ECA)的自动化或固定模式的语音命令方案,往往过于僵化,缺乏适应性的推理能力。它们难以动态整合多样化的上下文因素来推断用户未明确表述的目标。而近年来兴起的大语言模型代理虽然展现出强大的自然语言理解和推理能力,能够处理模糊和上下文相关的命令,但它们通常依赖云端部署,带来了隐私泄露、响应延迟和计算开销等严重问题,阻碍了在实际家居环境中的广泛应用。
更关键的是,纯粹基于神经网络的方在缺乏领域知识或冲突解决机制时,可能表现出不透明或不安全的行为,进一步限制了其在安全关键或高度个性化家庭场景中的可靠性。这些挑战自然促使研究人员探索在设备端部署小语言模型(small Large Language Model, sLLM)作为解决方案。虽然sLLM能够通过本地数据处理缓解隐私、延迟和计算开销的担忧,但其语言理解和计划合成能力与云端大模型相比仍然存在固有局限。没有强大的上下文基础,即使是设备端sLLM也难以可靠地解释模糊意图并生成准确、无冲突的行动计划。
为了解决这些挑战,韩国成均馆大学和三星电子的研究人员在《IEEE Access》上发表了题为"On-Device Intent Reasoning for Smart Home Agents via Ontology-Augmented sLLMs"的研究论文,提出了CIDER(Context-aware Intent-driven Device Edge Reasoning)框架——一个本体增强的、设备端意图推理系统,它将sLLM与常识性设备知识和用户特定上下文相结合,在一个结构化的基于本体的知识图谱中组织这些信息。
研究人员为开展这项研究,主要采用了以下几个关键技术方法:首先开发了智能家居本体构建流程,利用云端LLM提取和组织设备常识知识,并整合来自智能家居服务的用户特定上下文;其次设计了基于分类的自适应推理机制,将用户话语分类为五种不同类型并确定最优推理路径;最后实现了动态本体知识图谱更新机制,通过语义感知的事件驱动增量更新保持知识准确性。评估基于SmartThings平台的三个复杂度递增的测试环境,使用来自AI-Hub韩国智能家居命令语料库和Fluent Speech Commands数据集的283条测试语句。
命令分类体系的建立
通过对大规模、语言多样的语料库分析,研究人员首先建立了一个细粒度的命令分类体系。他们分析了AI-Hub韩国智能家居命令语料库中的13,669条用户话语和Fluent Speech Commands数据集中的30,043条话语,基于动作(Action)、目标(Target)、参数(Parameters)等核心信息组件的明确性,将智能家居命令分为五类:目标明确命令、动作特定命令、目标驱动命令、上下文相关命令和设备状态查询。这一分类为CIDER的自适应处理路径奠定了基础。
CIDER框架架构
CIDER框架采用两阶段意图推理过程。离线阶段构建本体知识图谱,通过"基础KG构建"过程将特定智能家居配置的物理和功能细节映射到定义的模式中,然后通过云端LLM增强常识相关性规则,并整合个性化规则。在线阶段则进行基于分类的自适应意图推理,使用设备端sLLM对输入用户话语进行分类,然后根据分类选择相应的处理路径。
本体知识图谱构建管道
CIDER的强大意图推理能力建立在一个全面的、基于本体的知识图谱上,该图谱通过系统化的离线管道构建,整合了多种知识源。这个管道包括三个主要阶段:通过分析智能家居服务的环境数据生成基础KG,通过分析用户体验并整合偏好和习惯来丰富KG,以及使用云端LLM发现和链接设备相关性规则来增强KG的常识知识。知识图谱采用OWL等标准定义正式本体模式,核心类包括Device、Sensor、Actuator、Room等,通过hasComponent、hasCapability、hasStatus等关系相互连接。
动态知识图谱更新机制
针对智能家居环境的动态特性,CIDER采用了语义感知的事件驱动增量KG更新机制。该机制包括事件驱动的变更检测、语义影响分析和局部子图重新推理三个步骤。当发生设备添加移除或状态变化等事件时,系统只对受影响的知识图谱子图进行推理更新,显著降低了计算开销,相比完整的KG重新初始化,更新效率大幅提高。这种智能选择性更新机制证明了该方法在资源受限的设备端系统中的适用性。
分类引导的自适应推理
用户话语被分类后,CIDER启动一个多阶段的自适应意图推理过程,该过程由本体知识图谱和设备端sLLM引导,系统分为意图解析、计划生成和计划选择三个主要阶段。在意图解析阶段,用户话语首先经过"语义分解"的结构化分析过程,最终进行"五类型分类"以产生精炼的意图。在计划生成阶段,查询本体知识图谱以检索相关设备、用户偏好和上下文信息。在计划选择阶段,生成的计划经过严格评估,每个候选计划都进行"组检查"以识别和过滤潜在的安全或操作冲突,剩余的有效计划被评分,选择"最大得分计划"执行。
实验评估结果
在三个复杂度递增的测试环境(简单家庭、家庭住宅、复杂家庭)中的评估表明,CIDER在最复杂的家庭环境(测试床3)中实现了76.61%的整体成功率,显著优于所有基线方法。重要的是,CIDER表现出优异的可扩展性,当从测试床1转到测试床3时,性能仅下降13.25个百分点,比其他LLM-based代理和商业平台表现更好。消融研究进一步证实了CIDER核心组件的重要性,当完全移除知识图谱时,成功率下降至61.29%,表明本体知识图谱对上下文感知推理的关键作用。
跨平台通用性验证
为了验证CIDER在SmartThings生态系统之外的通用性,研究人员在Home Assistant平台上进行了额外实验。结果显示CIDER在Home Assistant平台上保持了优越性能,显著优于强基线,证明了基于本体的知识图谱方法的鲁棒性,表明CIDER的核心推理能力与特定平台的API或数据模型没有紧密耦合,而是具有高度可移植性,展示了其在多样化智能家居生态系统中更广泛应用的潜力。
案例研究:自适应规划与可解释性
通过一个具体案例展示了CIDER的可解释性和高级意图推理能力。针对用户模糊命令"这里有点闷",CIDER首先将其分类为目标驱动命令,然后查询知识图谱语义分解"闷"的概念并收集所有相关上下文因素,生成多个候选计划并系统评估,最终选择通过打开窗户并先关闭加热器来解决冲突的最优方案。这一过程体现了CIDER如何超越简单评分,主动检测和解决冲突,得出满足用户潜在意图的最佳行动方案。
本研究通过CIDER框架的创新设计,成功解决了智能家居环境中设备端意图推理的关键挑战。该框架的核心价值在于将符号知识表示与神经语义处理相结合,通过从云端LLM提炼的本体知识增强设备端sLLM的推理能力。实验结果表明,即使在最复杂的家居环境下,CIDER也能实现76.6%的成功率,显著优于现有方法,同时保持了对模型量化的鲁棒性,验证了其在资源受限边缘设备上实际部署的可行性。
CIDER框架的提出为智能家居自动化指明了新的技术方向,通过本体引导的上下文检索与轻量级神经规划相结合,实现了无需云端解决方案的延迟、隐私风险或计算开销的最先进意图理解。未来工作的重点将包括多用户个性化、多语言和文化本地化部署以及处理初始话语分类阶段可能出现的误分类的鲁棒性增强,进一步推动设备端智能推理技术在更广泛物联网场景中的应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号