基于正样本无标签学习和知识图的生物医学信息检索

《ACM Transactions on Intelligent Systems and Technology》:Biomedical Information Retrieval with Positive-Unlabeled Learning and Knowledge Graphs

【字体: 时间:2025年11月08日 来源:ACM Transactions on Intelligent Systems and Technology

编辑推荐:

  生物医学信息检索中,基于预训练语言模型和知识图谱的关键词提取方法结合迭代正负样本学习实现零样本检索,PubMed数据集验证其优于传统方法。

  

摘要

生物医学文献的快速增长给信息检索领域带来了重大挑战。现有的大多数研究都集中在基于明确查询的文档检索上。然而,在实际应用中(如生物医学数据库的维护),往往缺乏明确的查询条件。在本文中,我们提出了一种两步模型,用于在仅有少量示例文档且没有明确查询的情况下进行生物医学信息检索。首先,我们利用大型预训练的语言模型和生物医学知识图谱从这些文档中提取关键词,然后对这些关键词进行领域特定实体的补充。信息检索技术可以利用这些实体对文档进行排序。接下来,我们引入了一种迭代式的正样本-无标签学习方法来对所有未标记的文档进行分类。在PubMed数据集上进行的实验表明,所提出的方法优于现有的最先进正样本-无标签学习方法。实验结果凸显了将大型语言模型和生物医学知识图谱结合在一起在提高生物医学领域零样本信息检索性能方面的有效性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号