一种结合模糊信息粒度和知识引导的集成多属性图序列聚类方法

《Neurocomputing》:An integrated multi-attribute graph sequence clustering with fuzzy information granule and knowledge-guidance

【字体: 时间:2025年07月17日 来源:Neurocomputing 5.5

编辑推荐:

  多跳知识图谱问答中,基于强化学习的SCR框架通过子图完成与语义奖励解决知识图谱不完整和奖励稀疏问题。子图完成利用知识图谱嵌入预测缺失三元组,语义奖励通过原问题与关系路径语义相似度提供部分奖励。实验在PQ、PQL、MetaQA、WebQSP上验证,尤其在稀疏图谱下性能显著提升。

  知识图谱(Knowledge Graph, KG)在自然语言处理(Natural Language Processing, NLP)领域中得到了广泛的应用。它通过结构化的方式存储和表示大量信息,为各种任务提供了强大的支持。其中,知识图谱问答(Knowledge Graph Question Answering, KGQA)是一个重要的研究方向,旨在通过推理知识图谱中的信息,回答自然语言提出的问题。在KGQA任务中,单跳问答通常是指通过一个三元组(实体-关系-实体)直接找到答案,而多跳问答则需要多个三元组进行推理,从而得出最终的答案实体。近年来,随着多跳问答任务的复杂性增加,研究者们开始关注如何在不依赖外部资源的情况下,提升模型的推理能力和可解释性。

在多跳问答任务中,一个显著的挑战是知识图谱的不完整性。即便知识图谱规模庞大,其内容仍然存在大量缺失的三元组,这使得基于强化学习(Reinforcement Learning, RL)的模型在推理过程中难以获取正确的实体信息。以Freebase为例,对于所有“Person”类型的实体,超过60%的实体缺乏诸如“profession”、“place of birth”和“nationality”等关系,而“spouses”和“education”相关的信息甚至有超过90%的缺失。这些缺失不仅影响模型的性能,还可能导致推理路径的错误。此外,强化学习模型在训练过程中通常面临稀疏奖励的问题,即只有当推理路径的最后一个实体是正确答案时,才会获得正奖励(1),否则奖励为0。这种奖励机制导致模型在训练过程中接收大量零奖励,从而难以有效学习和优化。

为了解决上述两个问题,本文提出了一种新的框架——完成后再推理(Completion-Then-Reasoning, SCR)。该框架的核心思想是,在进行多跳推理之前,首先从原始知识图谱中提取与问题相关的子图,并利用知识图谱嵌入模型(Knowledge Graph Embedding Model, KGE)对子图中缺失的三元组进行预测和补全。这样可以在推理之前提供更完整的知识支持,从而减少因知识缺失导致的错误。随后,基于补全后的子图,使用强化学习进行多跳推理,以获取最终的答案实体。通过这种方式,SCR框架能够在不依赖外部资源的前提下,提高模型的推理能力和可解释性。

在处理知识图谱不完整性问题时,SCR框架采取了一种分阶段的策略。首先,通过问题分析,从原始知识图谱中提取与问题相关的子图。这一过程通常基于问题中的关键词或实体,将知识图谱中与问题相关的信息集中提取出来。接着,利用知识图谱嵌入模型对子图中的缺失三元组进行预测和补全。这种方法不仅能够增强子图的完整性,还能保留知识图谱的原始结构,避免引入外部信息带来的偏差。完成子图后,模型基于补全后的信息进行多跳推理,从而获得更准确的答案。

为了应对强化学习中的稀疏奖励问题,SCR框架引入了一种基于语义的奖励机制。传统的强化学习模型在训练过程中,只有当推理路径的最后一个实体是正确答案时,才会获得正奖励,否则为零。这种机制使得模型在训练过程中难以有效学习,因为大部分情况下都会得到零奖励。为此,SCR框架设计了一种新的语义奖励,该奖励基于原始问题与整个关系路径之间的语义相似度。通过计算原始问题与推理路径中关系序列的语义相似度,模型可以对部分正确的路径给予一定的奖励,从而缓解稀疏奖励带来的训练困难。这种方法不仅提升了模型的学习效率,还增强了推理过程的语义连贯性。

在实验设计方面,本文选取了四个不同的数据集进行评估,包括PathQuestion(PQ)、PathQuestion-Large(PQL)、MoviE Text Audio QA(MetaQA)以及WebQuestionSP(WebQSP)。这些数据集涵盖了多种多跳问答任务,能够全面评估SCR模型在不同场景下的性能。实验分为两种设置:默认知识图谱设置和稀疏知识图谱设置。在默认设置下,知识图谱是完整的,模型的表现可以作为基准进行比较。而在稀疏设置下,知识图谱中部分三元组被随机移除,以模拟实际应用中常见的不完整情况。通过对比实验结果,可以清晰地看到SCR模型在处理不完整知识图谱时的优势。

实验结果表明,SCR模型在默认知识图谱设置下已经优于现有的基线模型,而在稀疏知识图谱设置下,其性能提升更加显著。这说明,SCR框架在缓解知识图谱不完整性问题方面具有良好的效果。此外,通过消融实验和案例分析,进一步验证了SCR模型各个组件的必要性和有效性。例如,在去除子图补全模块后,模型的性能明显下降,表明该模块在提升推理准确性方面起到了关键作用。而在去除语义奖励机制后,模型的训练效果也受到影响,说明语义奖励在解决稀疏奖励问题中发挥了重要作用。

SCR框架的创新点在于其将知识图谱的补全与推理过程相结合,形成了一种新的任务处理流程。首先,模型通过子图补全机制,增强知识图谱的完整性,从而为后续的推理提供更丰富的信息支持。其次,通过引入语义奖励机制,模型能够在训练过程中获得更连续和有效的反馈,从而更好地学习和优化推理策略。这种分阶段的处理方式不仅提高了模型的性能,还增强了其可解释性,使得推理路径更加清晰和易于理解。

此外,SCR框架的实现过程中,还考虑到了模型的鲁棒性和泛化能力。通过在不同数据集上的测试,可以发现SCR模型在多种任务中都表现出色,表明其具有较强的适应性和通用性。同时,模型的优化过程也遵循了强化学习的基本原理,即通过不断尝试不同的推理路径,并根据获得的奖励进行策略调整。这种优化机制使得模型能够逐步改进其推理能力,最终达到较高的准确率。

在实际应用中,SCR框架的提出对于提升多跳知识图谱问答系统的性能具有重要意义。首先,它能够有效应对知识图谱的不完整性问题,使得模型在面对缺失信息时依然能够进行准确的推理。其次,它通过引入语义奖励机制,解决了强化学习中稀疏奖励带来的训练困难,提高了模型的学习效率。最后,SCR框架在不依赖外部资源的前提下,实现了良好的可解释性,使得模型的推理过程更加透明和易于分析。

总之,本文提出的SCR框架在多跳知识图谱问答任务中展现出了显著的优势。通过结合知识图谱补全和语义奖励机制,SCR模型不仅能够提升推理的准确性,还能增强模型的鲁棒性和可解释性。实验结果表明,该模型在处理不完整知识图谱时表现尤为突出,为未来的研究提供了新的思路和方法。同时,SCR框架的提出也为知识图谱问答任务的进一步发展奠定了基础,有望在实际应用中发挥更大的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号