基于滑动窗口和标签知识的跨度少样本命名实体识别方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Engineering Applications of Artificial Intelligence》：Span-based sliding window feature extraction and label knowledge for few-shot Named Entity Recognition

【字体：大中小】 时间：2025年10月16日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

　　本文提出WLNER模型，通过滑动窗口机制提取局部特征解决字符歧义问题，采用双仿射变换处理嵌套实体，并引入句子级辅助任务预测实体数量。该方法在少样本命名实体识别（NER）任务中显著提升性能，在跨语言数据集上达到先进水平。

Highlight

新方法：我们提出了一种基于跨度的滑动窗口特征提取模型，能有效处理扁平化和嵌套式NER任务。通过滑动窗口机制进行局部特征提取，我们的方法完全摆脱了对外部知识的依赖。

新视角：我们开发了句子级辅助任务模块，通过预测目标实体数量进行联合训练。该模块高效利用标签知识，显著提升了模型的实体感知能力。

先进性能：在中文和英文的嵌套与扁平化基准数据集上的实验结果表明，我们的方法具有卓越性能和泛化能力，达到了先进水平。

Related work（相关工作）

基于词典的模型：先前研究通过将外部知识（如词汇信息）融入模型取得了显著成功。这些方法主要侧重于通过补充信息（包括词汇特征、汉字部首和语音元素）来丰富嵌入表示。例如，Zhang和Yang（2018）整合了字符和词汇信息，利用LSTM...

Method（方法）

在本节中，我们介绍提出的WLNER模型。如图2所示，WLNER包含三个模块：局部特征提取与融合、双仿射变换以及句子级辅助任务模块。我们将在后续章节中详细描述每个模块。

Experimental setup（实验设置）

数据集：我们在五个中文和三个英文数据集上评估模型性能。中文数据集包括四个扁平化数据集：Weibo、Youku、Taobao和Resume，以及一个嵌套数据集CMeEE-v₂。英文数据集包括两个扁平化数据集MIT-Movie和CoNLL03，以及一个嵌套数据集GENIA...

Conclusion（结论）

本文提出WLNER，一种利用局部特征和标签知识进行少样本NER的基于跨度的方法。为捕捉更全面的序列信息，我们设计了固定大小的滑动窗口机制，并引入名为注意力门控的融合技术，通过结合提取的特征来增强文本表示，同时减少噪声。为应对扁平化和嵌套实体带来的挑战，我们利用双仿射变换进行实体识别...

热点排行

新闻专题

联系信箱：

粤ICP备09063491号