基于知识图谱语义融合的系统建模语言(SysML)元素模型集成方法

《Proceedings of the Design Society》:Semantic fusion of SysML elements for model integration utilizing knowledge graphs

【字体: 时间:2026年07月03日 来源:Proceedings of the Design Society

编辑推荐:

  虽然自上而下的系统工程(Systems Engineering, SE)支持定义系统边界和接口,但实际实施通常以自下而上的方式进行,从而导致对系统建模语言(SysML)模型进行集成的需求。目前,这种集成受到命名不一致、抽象层级不同以及接口不明确等因素的阻碍。本

  
虽然自上而下的系统工程(Systems Engineering, SE)支持定义系统边界和接口,但实际实施通常以自下而上的方式进行,从而导致对系统建模语言(SysML)模型进行集成的需求。目前,这种集成受到命名不一致、抽象层级不同以及接口不明确等因素的阻碍。本研究提出了一种新颖的集成方法,利用资源描述框架(Resource Description Framework, RDF)知识图谱(Knowledge Graph, KG)和大语言模型(Large Language Model, LLM)驱动的实体对齐(Entity Alignment, EA)技术,并结合相似度阈值来执行语义融合。一个实际用例展示了基于余弦相似度阈值的正确合并结果。
### **基于知识图谱语义融合的SysML模型集成研究解读**

**一、 研究背景、问题与动机**

基于模型的系统工程(Model-Based Systems Engineering, MBSE)作为一种结构化的应用方法,旨在通过形式化模型支持系统工程活动,并实现系统元素及其关系的一致表示,在复杂产品开发中日益受到工业界和学术界的关注。然而,MBSE的实际应用面临显著挑战,尤其是在模型集成方面。

在理想情况下,系统工程遵循自上而下的方法,即在确定内部行为和结构之前,自上而下地定义直至最低系统层级的接口。但在实践中,详细接口定义所需的知识往往分散在不同开发部门,且多基于以往项目经验,这使得纯粹的自上而下方法难以实施。例如,在汽车领域,整车架构的定义通常在不同组织单元中并行进行,开发团队专注于制动或转向等单个子系统,缺乏对整体架构的集成视图。这导致了一种自上而下与自下而上并行的开发模式,虽然从效率和风险角度是合适的,但也产生了多个独立的子系统模型。

在缺乏高层级集成架构的情况下,难以评估定义的接口是否兼容、是否存在重叠或不一致。因此,无法可靠地评估跨系统功能(如能量回收)。这就产生了集成不同子系统以保障功能、检查接口兼容性或为后续开发活动提供输入的需求。此外,在跨项目系统模型重用场景中,模型集成也至关重要,通常需要通过集成不同系统模型的元素来创建中央存储库(Repository)。

研究人员将模型集成定义为将两个或多个SysML模型(或其子集,如功能或组件)系统性地合并为一个一致的SysML模型的过程。在此过程中,主要面临三大挑战:
1. **边界与接口定义不足**:可能导致整体系统架构中出现结构重叠或冗余。
2. **建模的抽象层级异构**:子系统常采用不同的建模规范,导致模型深度不兼容,阻碍无缝集成。
3. **元素命名不一致**:缺乏统一命名规范,相同的现实实体可能用不同术语表示,或同一术语在不同子系统中指代不同元素。这在元素出现在多种图表类型(如在活动图中作为泳道组件、在内部块图中作为结构元素)时尤为突出。

这些挑战阻碍了一致性架构模型的集成,从而限制了其在设计定义中的有效运用。当前集成困难极大地复杂化了MBSE的实施,无论是自下而上的开发环境还是模型重用场景。因此,本研究旨在系统性地支持MBSE中的模型集成。

**二、 研究目标、方法与论文概览**

本研究发表于《Proceedings of the Design Society》,其核心目标是减少在MBSE背景下,因SysML模型的异构命名和表示而产生的语义模糊与不一致性。通过实现系统元素名称的语义比较,促进更高效、一致的模型集成。为此,研究提出了一个结合知识图谱、实体对齐和语义融合的新方法。研究旨在回答两个核心问题:RQ1:如何在模型集成过程中系统性地支持两个或多个SysML模型的合并?RQ2:如何实现对语义分化的SysML元素的集成?

为达成研究目标,研究人员遵循了文献回顾、概念开发、技术实现与案例验证的科研流程。论文主体结构包括:引言部分阐述背景与挑战;第二章综述MBSE中现有的模型集成方法,并介绍知识图谱和基于大语言模型的实体对齐技术;第三章提出基于语义支持的模型集成概念方法;第四章详述技术实现与案例研究;第五章总结结论、局限性与未来研究方向。

**三、 关键技术方法概述**

本研究提出的方法核心是构建一个基于知识图谱的语义集成工作流,主要包含以下几个关键技术环节:
1. **信息提取与知识图谱构建**:将输入的SysML模型(以XML格式导出)中的相关元素、关系和属性提取出来,使用YARRRML映射语言和RMLMapper工具,将其转换为基于RDF标准的、以Turtle格式表示的知识图谱。在此图谱中,系统元素被建模为节点,关系被建模为边。
2. **基于大语言模型的实体对齐与语义相似度计算**:采用扩展的EasyEA框架进行实体对齐。利用大语言模型(本研究使用ChatGPT-5.1)对知识图谱节点进行信息摘要,合成来自元素名称、需求、功能及关系上下文的语义信息,生成向量嵌入。随后,计算节点对之间的余弦相似度,以量化其语义接近程度。相似度值存储在相似度矩阵中,范围从-1(负相关)到+1(正相关)。
3. **基于相似度阈值的集成决策逻辑**:根据计算出的余弦相似度值,实施结构化的集成决策。具体阈值基于一个独立的子系统数据集(源自割草机案例)手动验证后设定:相似度≥0.87视为强语义等价,可自动合并;相似度在0.5至0.87之间为模糊情况,需研究人员手动验证;相似度<0.5视为语义分化,不予合并,保留为独立实体。对于模糊情况,还会将元素名称与现有术语表(包含明确定义及同义词)进行比对,以辅助决策。
4. **知识图谱合并与SysML模型重构**:将根据决策逻辑对齐和合并后的实体整合为统一的知识图谱。最后,通过XML模板将集成后的知识图谱转换回SysML兼容的XML格式,重新实例化为集成的系统模型元素,确保与标准SysML工具链的兼容性。

**四、 研究结果分析**

研究人员通过一个简化的车辆驱动系统案例研究(包含制动系统模型和转向系统模型)来验证所提方法的可行性与效果。

* **4.2. 案例研究描述**:案例中两个SysML模型代表了车辆的子系统,包含重叠的功能与结构元素(如需求、传感器相关组件),但具有不同的命名规范和结构表示。例如,制动系统模型包含“Sensor system”(传感器系统)、扭矩传感器和制动磨损传感器;转向系统模型包含名为“Sensors”(传感器)的子系统,其中有扭矩传感器和方向盘传感器。
* **4.3. 集成结果与解释**:实施结果表明,该方法能够成功识别并语义对齐两个子系统模型中的等效元素,并在适当情况下将其合并为统一节点。
* **需求“recuperation”(能量回收)**:尽管在两个模型中的命名和描述上下文存在差异,但仍被检测为等效并合并为单一需求节点。
* **子系统级元素“sensor system”与“sensors”**:被对齐并合并,反映了它们在子系统层级的功能等价性。
* **组件级元素“torque sensor”与“torque sensors”**:被正确识别为语义等效并合并。
* **差异化元素**:如“brake wear sensor”(制动磨损传感器)和“steering wheel sensor”(方向盘传感器)因其代表不同的功能角色,被保留为独立的节点,维持了必要的系统区分。

这些结果证明了该方法能够区分语义等效和分化的元素,从而支持自动化集成和受控的差异化处理。尽管在某些模糊情况下需要人工验证,但整个流程证明了所提方法在支持RQ1(实现多SysML模型的系统集成)和RQ2(提供基于语义相似度的差异化集成策略)方面的可行性。

**五、 结论、局限与未来展望**

**讨论与结论**:
本研究开发并展示了一种基于知识图谱、实体对齐和语义融合的、可重用的概念与技术方法,旨在支持MBSE中异构SysML模型的集成。关于RQ1,研究表明通过基于知识图谱的工作流(将模型元素转换为语义增强的表示,并应用实体对齐机制来识别跨模型等效元素),可以系统地实现SysML模型集成。关于RQ2,所提方法引入了基于相似度阈值的差异化决策逻辑,能够区分自动融合、人工验证和保留独立元素的情况,从而提供了针对语义分化程度量身定制的结构化集成策略。

本工作的核心科学贡献在于开发并演示了一种可重用的概念和技术方法,弥合了现有技术中语法集成机制与真实MBSE环境对语义鲁棒模型集成需求之间的差距。通过集成知识图谱技术和大语言模型驱动的实体对齐,本研究推进了当前实践,为可扩展和可追溯的SysML模型集成奠定了基础。

**局限性**:
1. **方法论局限**:方法主要关注语义比较,尚未解决结构一致性检查、行为兼容性或接口完整性等系统集成的关键方面。
2. **阈值依赖**:依赖于经验确定的余弦相似度阈值,其最优性和对其他数据集或工业场景的适用性存在不确定性。
3. **技术覆盖**:实现受限于可从基于XML的SysML表示中提取的信息范围,未能覆盖完整的SysML语言谱系。
4. **案例简化**:案例研究使用了简化的子系统场景数据集,未能体现大规模工业模型的复杂性、层次深度和变异性,因此关于可扩展性和普适性的结论需谨慎看待。
5. **自动化程度**:集成过程在模糊情况下部分依赖人工验证,限制了自动化程度并引入了主观性。
6. **对比成熟度**:与现有方法相比,本方法提供了更大的语义灵活性,但缺乏更成熟集成框架中常见的自动化一致性检查和大规模验证。

**未来研究方向**:
1. **方法形式化**:将所提方法形式化为一个完全定义的方法,包括系统性地规范需求、功能和评估标准。
2. **扩展分析范围**:将概念扩展到包含结构和行为一致性分析,如接口兼容性和依赖性验证,以应对第一章强调的MBSE集成挑战的全谱系。
3. **阈值校准自动化**:通过自适应或基于学习的机制实现阈值校准自动化,减少对经验定义参数的依赖。
4. **引入量化评估指标**:引入精确率、召回率和对齐准确率等量化评估指标,以实现客观评估并与现有集成方法进行基准测试。
5. **集成领域本体**:集成领域本体以改进语义 grounding(基础)。
6. **探索自动化融合策略**:探索利用大语言模型驱动推理的全自动融合策略。
7. **工业验证**:在真实的工业MBSE工作流中验证该方法。这些发展将增强语义支持的SysML模型集成方法的实际适用性和科学成熟度。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号