知识图谱实体对齐中伪标签高效筛选:对比学习与交叉熵联合优化(TSJO)模型研究

【字体: 时间:2025年09月04日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文提出了一种基于两阶段联合优化(TSJO)的实体对齐模型,通过结合交叉熵损失与对比学习(Contrastive Learning)优化嵌入表示,并创新性地设计了动态相对阈值(DR-T)算法与数据集轮换(D-Rot)策略,显著提升了伪标签在筛选速度、数量与准确性三方面的综合性能,为解决知识图谱(KG)融合中的对齐瓶颈提供了有效方案。

  

Highlight

  • 提出了一种用于实体对齐的两阶段联合优化模型TSJO,该模型利用交叉熵优化全局嵌入,并借助对比学习优化局部嵌入,从而使TSJO能够学习到更精准的实体语义表示。
  • 通过分析基于交叉熵的实体嵌入相似性分布特征,提出了一种动态相对阈值算法(DR-T)用于高效筛选伪标签。此外,为有效利用伪标签,提出了一种数据集轮换算法(D-Rot)。
  • 大量实验证明,与常用的基于单对实体相似性筛选、双向最近邻筛选以及最优传输(Optimal Transport)方法相比,我们的动态相对阈值算法在伪标签的数量、筛选速度和准确性方面均达到最优综合表现,从而实现了卓越的实体对齐性能。

Conclusion

贡献:本文的主要贡献包括提出了两阶段联合优化模型(TSJO)、高效的伪标签筛选算法(DR-T)以及数据集轮换算法(D-Rot)。实验证明,TSJO 有效利用了交叉熵损失与对比损失之间的相似性协同机制,显著提升了模型性能。DR-T 通过利用这些损失对相似性分布的影响,实现了高效且准确的伪标签筛选。D-Rot 则是一种交替使用新旧数据集的策略,有助于进一步提升实体嵌入表示的质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号