《IEEE Transactions on Knowledge and Data Engineering》:Cog-RMH: Cognition-Based Recalling Multiview History for Event Forecasting in Temporal Knowledge Graph
编辑推荐:
摘要:事件预测是时序知识图谱(Temporal Knowledge Graph, TKG)中的一项重要任务,旨在像人类一样利用历史记忆对未来未知事件做出明智决策。然而,根据多元智能理论(Multiple Intelligence)和编码–检索特异性理论(Enc
摘要:事件预测是时序知识图谱(Temporal Knowledge Graph, TKG)中的一项重要任务,旨在像人类一样利用历史记忆对未来未知事件做出明智决策。然而,根据多元智能理论(Multiple Intelligence)和编码–检索特异性理论(Encoding-Retrieval Specificity),现有方法违背了两种基本的人类决策范式,导致对TKG历史事件的表示不完整,从而阻碍后续未来预测性能。一方面,人类从多视角回忆记忆,而既往事件预测工作将历史序列单一地视为单视角范式,造成结构特征学习的不完整。另一方面,人类记忆复现(回忆)是一个双向过程。现有方法仅关注按时间顺序捕捉单向演化模式,未能恰当建模随时间变化的记忆复现–检索过程。本文提出一种新颖的TKG事件预测方法,即Cog-RMH,模拟人类认知范式并回想多视角历史(Recalling Multiview History)以支持未来决策。为解决前一挑战,研究人员从联想思维(杏仁核,Amygdala)、空间背景(海马体,Hippocampus)和逻辑推理(前额叶皮层,Prefrontal Cortex)智能中提取历史并发事件的内在结构特征,并综合其对未来事件的影响。为解决后一问题,研究人员提出了一种带有堆叠门控循环单元(Gated Recurrent Units, GRU)的编码器–解码器架构,以模拟包含认知依赖的双向记忆回溯与检索。研究人员进一步引入一种回溯–检索注意力机制(Retracing–Retrieval Attention),以建模回忆过程中不同时间戳事件随时间变化的人类关注侧重。大量实验表明,Cog-RMH在四个公开TKG基准数据集上取得了显著提升的事件预测性能……
论文解读:Cog-RMH——基于认知多视角历史回放的时序知识图谱事件预测
研究背景与问题提出
时序知识图谱(Temporal Knowledge Graph, TKG)以事实四元组(s, r, o, t)描绘事件,事件预测旨在依据历史数据推断未来未知事件,支撑经济预警、社会计算与推荐系统等应用。这一从历史学习以预测未来的过程,镜像了基于重放记忆的人类决策。
现有TKG外推预测方法通常从单视角结构信息与单向时序演化中学习方法。然而,多元智能理论(Multiple Intelligence)与编码–检索特异性理论(Encoding-Retrieval Specificity)指出,这类策略违背了两重人类基本认知范式:其一,记忆是多面的,而既往模型将历史序列限制为单视角(如仅关注直接关联邻域),忽略人类智能的联想、背景情境与逻辑推理等多面性;其二,回忆是双向双过程(回溯与检索),而传统模型仅捕捉从长时历史到短时未来的单向演化,且常规双向RNN(BiRNN)的前向与后向过程相互独立,未建模记忆存储(前向)与检索(后向)间的认知依赖。这些局限限制了模型捕捉多样结构视图与双向回溯–检索演化的能力,导致历史事件表示不完整,未来预测受限。为填补上述缺口,研究人员开展了此项研究,成果发表于《IEEE Transactions on Knowledge and Data Engineering》。
关键研究方法概述
研究人员提出Cog-RMH模型,核心设计包括:
- •
多视角智能对齐结构学习:分别从联想视图(Relation-aware GCN聚合直接邻域)、情境视图(扩展类型/属地等背景实体的GCN)与逻辑视图(双曲空间等距反射与旋转建模全局层级)提取历史并发事件特征;
- •
双向回溯–检索演化学习:以前向GRU编码回溯过程,其(t-1)隐态约束后向GRU的检索过程,形成具认知依赖的编码器–解码器;并引入基于Transformer的时间变化回溯–检索注意力(Retracing–Retrieval Attention);
- •
跨视图融合与双曲评分:以加性注意力融合联想与情境动态嵌入,映射至关系特定曲率双曲空间(Poincaré球),通过M?bius加法与双曲距离打分,以交叉熵损失训练。
实验在ICEWS05-15、ICEWS18、ICEWS14及GDELT四个基准TKG上,采用时间感知过滤指标(MRR、Hits@1/3/10)验证。
研究结果
主体方法与架构(Section III)
- •
双向回溯–检索演化学习(III-B)
回溯(Retracing)过程以前向GRU从近未来(t)向长时(t-k+1)传播,隐态ht-1→约束下一刻输入;检索(Retrieval)过程以后向GRU从长时向近未来传播,并将对应回溯隐态作为附加输入,建模认知依赖。研究人员设计时间变化回溯–检索注意力模块,以初始实体嵌入为Query,对双向输出序列做多头注意力(MHA)与前馈(FFN),动态加权不同历史时间戳的贡献。结论:相比独立BiRNN,认知依赖约束的双向过程更贴合人类记忆机制,注意力可刻画近因效应。
- •
多视角智能对齐结构学习(III-C)
- •
联想视图(Associative View, Amygdala):对每个历史子图用2层关系感知GCN聚合直接关联邻域,得到EAVτ。
- •
情境视图(Contextual View, Hippocampus):为实体补充“type_of”“affiliated_to”等背景上下文,扩展子图与关系,同样用关系感知GCN得到ECVτ。
- •
逻辑视图(Logical View, Prefrontal Cortex):以加性注意力融合前两视图的回溯–检索注意力输出,映射至双曲空间(exp0cr),通过关系特定块对角反射(Ref)与旋转(Rot)操作捕捉全局层级逻辑,以M?bius加法(⊕cr)平移主体并算双曲距离打分。
结论:三视图分别对应局部邻域、背景情境与全局层级,联合提升结构表示完备性。
- •
训练策略(III-D)
采用多标签交叉熵损失,按时间切分与早停训练。
实验与结果(Section IV)
- •
主结果(IV-B)
在四个TKG基准上,Cog-RMH显著优于静态(ATTH、RE-SEGNN)、插值(TNTComplEx、IME、MADE)与外推(ReTIN、CognTKE、MV-NET、RE-GCN等)基线(MRR与Hits提升具统计显著性p<0.01)。稀疏集如ICEWS05-15因邻域与背景信号受限,增益相对收窄。与ReTIN比,Cog-RMH混合曲率与多视图协作更适配树状层级。
- •
消融研究(IV-C)
移除逻辑视图损伤最大;单独逻辑视图(无动态嵌入)退化为近静态双曲模型而表现骤降;移除情境视图略优于移除联想视图,说明TKG内直接关联强于外域背景,但情境仍具贡献;单独保留回溯–检索注意力较强,纯检索常优于纯回溯(近未来信息更关键),但全模型最优,证实认知复杂度必要而非仅参数量增加。
- •
多视图与多基线对照(IV-D、表VI-VII)
比多曲率IME/MADE更优(外推能力+GCN深度结构);比多子图MV-NET优(点积注意力的双向多视图协作胜加性注意);控制基线multi-REGCN与Cog-RMH-multiREGCN显示:共享编码器多视图有益,但本模型视图专属编码器+双曲头+回溯–检索协作更优。
- •
曲率配置与双曲优化(IV-E、IV-F)
关系特定曲率cr(软plus重参)优于一刀切全局固定曲率;初始化在[-5.0,-0.1]内稳定;学到曲率聚类为多层级子空间。双曲操作配边界投影(1-ε)/√cr与数值保护(artanh钳位、分母δ=10-15),保证流形有效与稳定。逻辑层级距离原点越近累积度越高,GDELT最树状,ICEWS14较平,MRR提升与|ξG|(平均|?cr|)趋势吻合。
- •
双向过程与注意力(IV-G、IV-H)
比常规BiRNN更优(认知依赖);逐时间戳MRR均正提升且方差更小(vs ReTIN),增益系统分布非少数“易日”。回溯–检索注意力权重βt近未来更高,吻合人类近因效应(Recency Effect);以Einit为Query优於以Et或全局可学向量,避免实体特定历史被单一共享Query平滑。
- •
超参敏感性(IV-I)
历史窗k各数据优选(GDELT=9, ICEWS14=6, ICEWS05-15=9, ICEWS18=12),过伸仍稳;Transformer 1层、2头、dropout=0.0、post-/pre-norm差异小;GCN 2层佳;维度d=20饱和,再扩收益低且过拟合。
- •
计算效率(IV-J)
时间复杂度O(k(N+M)+kd2+k2d+ωdN),内存O(Nkd)线性于实体数;峰值显存ICEWS18=5.5GB(A800),可扩展至50K/100K实体约12/24GB,可选梯度检查点与步幅稀疏注意力优化。
讨论与结论(Section V & 讨论部分浓缩)
研究人员讨论指出,当前Cog-RMH对全实体词表排序(而非受限候选池),H@10相对RL类受限基线的粗增益有压缩空间。未来计划将累积历史注意力权重ω(e)作动态过滤器,以可学习阈值θ构建候选集C,在保留全词表H@10下降噪,衔接受限池优势。
结论翻译总结:
本文提出Cog-RMH,以解决TKG事件预测中多视角与回溯–检索演化的不足。模型结构对齐人类脑区,整合联想(杏仁核)、情境(海马体)与逻辑(前额叶)特征(记忆收集),并功能建模双向回溯–检索机制动态加权历史时间戳(记忆回忆)。实验证明,Cog-RMH可有效学习时间戳内与跨时间戳表示,显著优于现有基线。未来将通过回溯–检索注意力导出的动态候选剪枝,进一步衔接全词表与受限池的性能边界。