
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于归一化流增强高斯嵌入的小样本知识图谱补全方法研究
【字体: 大 中 小 】 时间:2025年06月13日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决小样本知识图谱补全(FKGC)中关系不确定性和邻居噪声问题,研究人员提出NFGN模型,整合归一化流与高斯嵌入技术,通过GD-TransE解码器和门控邻居编码器处理复杂语义关系,实验显示MRR等指标提升5.7%-10.6%,为知识图谱不确定性建模提供新范式。
知识图谱(KG)作为结构化知识库,支撑着语义搜索和智能推荐等应用,但其构建过程常导致数据缺失。尤其对于长尾关系(如Wikidata中10%关系仅有不足10个实例),传统知识图谱嵌入(KGE)方法因样本稀疏而失效。小样本知识图谱补全(FKGC)虽应运而生,却面临两大挑战:一是将关系建模为确定性向量,忽视现实场景中如国籍关系的多义性(如误判“YeLi继承权”案例);二是邻居聚合时未过滤噪声且忽略交互作用(如“SubPartOf”被误标为“Location”)。现有高斯嵌入方法(如UFKGC)仅用单峰分布,难以捕捉“SubPartOf”等关系的多模态特性,导致推荐系统误推旅游而非球员信息。
为此,中国研究人员提出NFGN模型,发表于《Knowledge-Based Systems》。该研究通过多尺度CNN提取稀疏数据特征,利用归一化流将单高斯分布扩展为多语义复杂分布,创新性结合GD-TransE解码器(融合TransE与高斯匹配)和门控邻居编码器(多头自注意力+阈值门控),实现关系不确定性的精准建模与邻居噪声过滤。
关键技术包括:1) 基于NELL/WIKI/FB15K-237数据集构建少样本任务;2) 归一化流双向映射函数转换基分布z0
;3) GD-TransE评分函数整合高斯协方差;4) 门控编码器的多头注意力权重计算。
【研究结果】
【结论】NFGN首次将归一化流与高斯嵌入结合,突破传统FKGC的确定性建模局限,实验证明其在三大基准数据集上全面超越现有方法(如Hits@10提升6.7%)。该研究为医疗咨询、推荐系统等需处理不确定关系的场景提供新工具,未来可扩展至动态知识图谱时序建模。
(注:全文细节均依据原文,未添加外部信息;专业术语如FKGC/KGE等首次出现时已标注;数学符号使用/标签规范呈现)
生物通微信公众号
知名企业招聘