基于滑动窗口和标签知识的跨度少样本命名实体识别方法研究
《Engineering Applications of Artificial Intelligence》:Span-based sliding window feature extraction and label knowledge for few-shot Named Entity Recognition
【字体:
大
中
小
】
时间:2025年10月16日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文提出WLNER模型,通过滑动窗口机制提取局部特征解决字符歧义问题,采用双仿射变换处理嵌套实体,并引入句子级辅助任务预测实体数量。该方法在少样本命名实体识别(NER)任务中显著提升性能,在跨语言数据集上达到先进水平。
新方法:我们提出了一种基于跨度的滑动窗口特征提取模型,能有效处理扁平化和嵌套式NER任务。通过滑动窗口机制进行局部特征提取,我们的方法完全摆脱了对外部知识的依赖。
新视角:我们开发了句子级辅助任务模块,通过预测目标实体数量进行联合训练。该模块高效利用标签知识,显著提升了模型的实体感知能力。
先进性能:在中文和英文的嵌套与扁平化基准数据集上的实验结果表明,我们的方法具有卓越性能和泛化能力,达到了先进水平。
基于词典的模型:先前研究通过将外部知识(如词汇信息)融入模型取得了显著成功。这些方法主要侧重于通过补充信息(包括词汇特征、汉字部首和语音元素)来丰富嵌入表示。例如,Zhang和Yang(2018)整合了字符和词汇信息,利用LSTM...
在本节中,我们介绍提出的WLNER模型。如图2所示,WLNER包含三个模块:局部特征提取与融合、双仿射变换以及句子级辅助任务模块。我们将在后续章节中详细描述每个模块。
数据集:我们在五个中文和三个英文数据集上评估模型性能。中文数据集包括四个扁平化数据集:Weibo、Youku、Taobao和Resume,以及一个嵌套数据集CMeEE-v2。英文数据集包括两个扁平化数据集MIT-Movie和CoNLL03,以及一个嵌套数据集GENIA...
本文提出WLNER,一种利用局部特征和标签知识进行少样本NER的基于跨度的方法。为捕捉更全面的序列信息,我们设计了固定大小的滑动窗口机制,并引入名为注意力门控的融合技术,通过结合提取的特征来增强文本表示,同时减少噪声。为应对扁平化和嵌套实体带来的挑战,我们利用双仿射变换进行实体识别...
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号