今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

针对中医领域命名实体识别的知识蒸馏技术

《Scientific Reports》:Knowledge distillation for named entity recognition in traditional chinese medicine

【字体: 大 中 小 】 时间:2026年06月10日 来源:Scientific Reports 3.9

编辑推荐:

  摘要在中医(TCM)文本中,命名实体识别(NER)对于构建中医知识体系及其智能化应用至关重要。中医病例文本的特点是实体分布稀疏且领域特定数据有限。现有方法在识别低频实体方面存在困难,且在知识迁移方面能力不足。本文提出了一种结合结构化知识蒸馏的中医NER框架。首先,利用自然语言处理

  

摘要

在中医(TCM)文本中,命名实体识别(NER)对于构建中医知识体系及其智能化应用至关重要。中医病例文本的特点是实体分布稀疏且领域特定数据有限。现有方法在识别低频实体方面存在困难,且在知识迁移方面能力不足。本文提出了一种结合结构化知识蒸馏的中医NER框架。首先,利用自然语言处理技术构建了多源中医语料库。在高质量的结构化数据上训练出一个教师模型,并通过软标签将其语义知识传递给学生模型。学生模型采用BERT进行编码,BiLSTM进行序列特征提取,Transformer进行全局上下文建模,CRF进行结构化序列解码。在构建的StudentDataset上的实验结果表明,经过知识蒸馏后的TBTC模型相比未蒸馏模型,精确度提高了8.01个百分点,召回率提高了5.31个百分点,F1分数提高了6.67个百分点,整体F1分数达到了77.01。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:中医文本|命名实体识别|知识蒸馏|BERT|CRF|决策支持

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号