
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于抽象语义表征动态概率增益的事件论元抽取知识补偿方法研究
【字体: 大 中 小 】 时间:2025年07月02日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对事件论元抽取(EAE)任务中长距离依赖捕获不足的问题,研究人员提出AMR约束解码模型(AMCODE),通过AMR解析任务提供的先验论元线索构建动态概率增益,在ACE05等数据集上实现0.3%-2.0%的F1值提升,为语义解析与事件抽取的知识迁移提供新范式。
事件论元抽取(Event Argument Extraction, EAE)作为事件抽取的核心子任务,旨在从文本中识别特定事件类型的论元角色及对应文本片段。尽管现有研究通过抽象语义表征(Abstract Meaning Representation, AMR)的图结构或向量特征增强语义表示,但这类隐式利用方式忽略了AMR解析任务本身可直接提供关键论元线索的特性。据统计,ACE05数据集中38%的标注论元可直接从AMR图中获取,如"Jack Straw"作为会议事件中的Entity角色,传统方法因长距离依赖问题易遗漏此类论元。
为解决AMR知识利用不充分的问题,国内研究人员提出AMR约束解码模型(AMCODE)。该模型创新性地设计AMR实体检索算法,从AMR图中提取有效实体作为候选论元;通过门控特征融合模块建立论元角色与AMR实体的隐式关联;最关键的是引入角色特异性动态增益(Role-specific Dynamic Gains),在解码阶段调整输出概率分布,显式引导模型关注AMR提供的候选论元。实验表明,AMCODE在ACE05、RAMS和WIKIEVENTS数据集上分别取得0.3%、0.6%和2.0%的F1值提升,相关成果发表于《Expert Systems with Applications》。
关键技术方法包括:1) 基于AMR图的实体检索算法,保留潜在论元并剔除冗余信息;2) 将AMR实体转换为自然语言序列以保持句法一致性;3) 门控机制融合AMR实体特征与论元角色特征;4) 动态概率增益计算模块,根据角色-实体依赖关系调整解码权重。研究采用生成式预训练语言模型(PLMs)作为基础架构,在三个标准数据集上验证模型性能。
【AMR-derived实体检索】设计基于图遍历的算法提取AMR中的命名实体、时间表达式等,通过语义角色过滤保留与事件相关的候选论元,如"Jack Straw"被识别为person类型实体。
【特征融合模块】采用跨注意力机制交互AMR实体与源文本特征,门控单元动态控制信息流,使模型能自适应学习AMR线索与论元角色的关联模式。
【动态概率增益】计算候选实体位置与目标角色的相关性得分,将其转化为对数概率增益叠加到解码器输出层,显著提升"Place"等长距离论元的召回率。
研究结论表明,AMCODE首次实现从AMR解析到EAE任务的显式知识迁移。通过动态概率增益机制,模型能有效补偿传统方法在论元依赖建模上的不足,特别是在文档级数据集RAMS中,对跨句论元的识别准确率提升显著。该工作为语义解析与事件抽取的协同优化提供新思路,其知识补偿框架可扩展至其他语义增强型NLP任务。讨论部分指出,未来可探索AMR与事件图谱的联合建模,进一步强化结构化语义知识对复杂事件的理解能力。
生物通微信公众号
知名企业招聘