
-
生物通官微
陪你抓住生命科技
跳动的脉搏
双超图表征学习在超关系知识图谱中的应用:DHRL4HKG模型构建与链接预测性能提升
【字体: 大 中 小 】 时间:2025年06月26日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对超关系知识图谱(HKGs)中属性与值的一对多关系及高阶信息捕获难题,研究者提出DHRL4HKG模型,通过定义新型H-Facts并构建交互/内部超图,采用超图Transformer编码器实现双重视角表征学习。实验表明该方法显著提升链接预测性能,为复杂关系建模提供新范式。
在知识图谱研究领域,传统三元组(s, r, o)的表示方法已难以应对日益复杂的现实数据关系。超关系知识图谱(Hyper-relational Knowledge Graphs, HKGs)通过引入描述主三元组的限定符(attribute-value pairs)扩展了表达能力,但现有方法存在两大瓶颈:一是忽视属性与值之间的一对多关系(如"提名者"属性对应多个候选人的场景),导致属性冗余;二是难以有效融合主三元组与限定符的高阶交互信息(如"时间点:2001"这类时间限定条件)。这些问题严重制约了医疗知识推理、生物关系预测等关键场景的应用效果。
针对这些挑战,来自广西多源信息挖掘与安全重点实验室的研究团队在《Knowledge-Based Systems》发表创新成果。他们提出双超图表征学习框架DHRL4HKG,通过重新定义H-Facts的数学表达,构建刻画H-Facts间关联的inter-hypergraph和描述单事实内部结构的intra-hypergraph,并设计超图Transformer实现双重表征融合。在三个真实数据集上的实验表明,该方法在链接预测任务中MRR指标提升显著,尤其擅长处理具有复杂限定条件的医疗关系推理。
关键技术方法包括:(1) 基于one-to-many关系的H-Facts新定义;(2) 融合邻居信息的inter-hypergraph构建;(3) 捕捉单事实高阶关联的intra-hypergraph设计;(4) 超图Transformer编码器实现双重表征联合优化;(5) 采用Wikidata、JF17K等基准数据集验证性能。
【Method】
研究团队首先创新性地将H-Fact定义为包含主三元组和属性-值对集合的复合结构{(s,r,o),{(ai,vi)}i=1m},通过超边连接相同属性的不同值节点解决冗余问题。基于此构建的inter-hypergraph通过k-hop邻居聚合捕捉全局关联,而intra-hypergraph则利用超边同时连接主三元组与所有限定符,建模如"药物-副作用-时间条件"的复杂医疗关系。
【Experiments】
在Wikidata12k数据集上,DHRL4HKG的Hits@10达到0.742,较基准方法GRAN提升9.8%。特别在含时间限定条件的预测任务中,模型通过intra-hypergraph有效融合时序信息,使时间敏感型关系的预测准确率提高23.6%。消融实验证实双超图结构对性能贡献率达71.3%。
【Related work】
相比将H-Facts简单转为n元组的RAE方法或键值对处理的NaLP算法,该研究首次实现属性级关系建模。与异构图方法GRAN相比,超图结构使高阶关系参数量减少34%的同时保持更高表达能力。
【Conclusion】
该研究突破传统知识图谱表征学习的二元限制,通过双重超图架构实现:1)消除属性冗余的紧凑表征;2)主三元组与限定符的深度耦合。在生物医学关系预测场景中,模型能同时处理"基因-调控-组织特异性"等多维特征,为构建可解释的医疗知识系统提供新工具。未来工作将扩展至动态HKGs和跨模态知识融合方向。
生物通微信公众号
知名企业招聘