SplitE:通过实体分割和上下文化处理提高知识图谱嵌入的精度

《ACM Transactions on Recommender Systems》:SplitE: Enhancing Knowledge Graph Embedding Precision with Entity Split and Contextualization

【字体: 时间:2025年11月08日 来源:ACM Transactions on Recommender Systems

编辑推荐:

  知识图谱嵌入算法SplitE通过两阶段优化解决实体歧义和冷启动问题。第一阶段对低连接度实体生成初始嵌入,第二阶段对多义热点实体进行聚类和回合并入,提升嵌入精度。同时提出稳定节点聚合方法降低不稳定节点更新频率。实验表明SplitE在Walmart People.AI等百万级数据集上嵌入质量显著优于现有模型及大语言模型,验证其有效支持下游应用。

  

摘要

近年来,知识图谱领域的研究主要集中在通过提高向量空间的复杂性来增强图表示算法生成的嵌入的准确性。然而,致力于优化实体质量的研究相对较少。在不同上下文中具有不同含义的实体在提取过程中常常被错误地合并。本文介绍了一种创新的两阶段嵌入生成算法SplitE,用于知识图谱。该算法首先使用连接较少的非热点实体生成嵌入,然后通过聚类和合并算法对具有多种含义的热点实体进行分割和上下文化处理。SplitE算法能够精确区分不同上下文中的多义实体,从而生成更高质量的嵌入。此外,我们提出了一种新的改进方法,旨在解决多年来一直困扰该行业的知识图谱模型的“冷启动”问题。对于频繁更新的实体(称为不稳定实体),我们设计了一种聚合函数,利用更新频率较低的节点(称为稳定实体)来计算它们的嵌入,从而减少重新训练的频率。我们研究的另一个重点是SplitE生成的嵌入与现有知识图谱算法及当代大型语言模型生成的嵌入之间的性能比较。结果表明,在评估任务中,SplitE生成的嵌入始终优于最先进的大型语言模型生成的嵌入。这包括在Walmart的People.AI知识图谱(包含160万个节点和8300万条边)以及其他基准数据集上的优越性能。SplitE在如此复杂环境中的成功应用凸显了其在支持知识图谱领域各种下游应用方面的有效性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号