基于滑动窗口和标签知识的跨度少样本命名实体识别方法研究

《Engineering Applications of Artificial Intelligence》:Span-based sliding window feature extraction and label knowledge for few-shot Named Entity Recognition

【字体: 时间:2025年10月16日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文提出WLNER模型,通过滑动窗口机制提取局部特征解决字符歧义问题,采用双仿射变换处理嵌套实体,并引入句子级辅助任务预测实体数量。该方法在少样本命名实体识别(NER)任务中显著提升性能,在跨语言数据集上达到先进水平。

  
Highlight
新方法:我们提出了一种基于跨度的滑动窗口特征提取模型,能有效处理扁平化和嵌套式NER任务。通过滑动窗口机制进行局部特征提取,我们的方法完全摆脱了对外部知识的依赖。
新视角:我们开发了句子级辅助任务模块,通过预测目标实体数量进行联合训练。该模块高效利用标签知识,显著提升了模型的实体感知能力。
先进性能:在中文和英文的嵌套与扁平化基准数据集上的实验结果表明,我们的方法具有卓越性能和泛化能力,达到了先进水平。
Related work(相关工作)
基于词典的模型:先前研究通过将外部知识(如词汇信息)融入模型取得了显著成功。这些方法主要侧重于通过补充信息(包括词汇特征、汉字部首和语音元素)来丰富嵌入表示。例如,Zhang和Yang(2018)整合了字符和词汇信息,利用LSTM...
Method(方法)
在本节中,我们介绍提出的WLNER模型。如图2所示,WLNER包含三个模块:局部特征提取与融合、双仿射变换以及句子级辅助任务模块。我们将在后续章节中详细描述每个模块。
Experimental setup(实验设置)
数据集:我们在五个中文和三个英文数据集上评估模型性能。中文数据集包括四个扁平化数据集:Weibo、Youku、Taobao和Resume,以及一个嵌套数据集CMeEE-v2。英文数据集包括两个扁平化数据集MIT-Movie和CoNLL03,以及一个嵌套数据集GENIA...
Conclusion(结论)
本文提出WLNER,一种利用局部特征和标签知识进行少样本NER的基于跨度的方法。为捕捉更全面的序列信息,我们设计了固定大小的滑动窗口机制,并引入名为注意力门控的融合技术,通过结合提取的特征来增强文本表示,同时减少噪声。为应对扁平化和嵌套实体带来的挑战,我们利用双仿射变换进行实体识别...
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号