从专利文献中提取文本信息:系统综述

《Management Review Quarterly》:Mining textual fields from patent documents: systematic review

【字体: 时间:2025年09月27日 来源:Management Review Quarterly 9

编辑推荐:

  专利数据库作为技术情报源,文本挖掘在处理数据量大、结构复杂及多语言半结构化文本时面临挑战。本研究通过系统文献综述分析2018-2025年间117篇专利文本挖掘研究,总结三大主题:技术趋势、预处理与分析方法工具、应用场景与局限,为SDGs战略决策提供支持。

  

摘要

专利数据库是获取技术情报的主要来源,能够提供关于各个领域最新和新兴技术的见解。文本挖掘在提取这些情报方面发挥着重要作用,然而这一过程由于数据量庞大、专利文本结构复杂以及专利文本的独特特性(包括法律与技术语言的结合、多语言内容以及半结构化数据格式)而变得相当复杂。本研究通过对2018年至2025年间发表在Scopus和Web of Science数据库中的相关研究进行系统性文献回顾(SLR),探讨了应用于专利文档的文本挖掘方法。共分析了117篇科学论文和会议论文,从而确定了以下关键主题:(1)专利文本挖掘的趋势;(2)预处理和分析的主要方法及推荐工具;(3)实际应用中的影响与局限性评估。作为一项实践性和管理方面的贡献,该文献回顾总结了该领域的主要方法进展和新兴趋势,并综合了经过验证的方法中的关键建议,以指明未来的研究方向。通过分析专利文档的文本内容,可以提取出解决实际问题的科学技术知识,这些知识有助于提升竞争优势和制定战略决策,最终成为实现2030年可持续发展议程(SDGs)目标的重要工具。

专利数据库是获取技术情报的主要来源,能够提供关于各个领域最新和新兴技术的见解。文本挖掘在提取这些情报方面发挥着重要作用,然而这一过程由于数据量庞大、专利文本结构复杂以及专利文本的独特特性(包括法律与技术语言的结合、多语言内容以及半结构化数据格式)而变得相当复杂。本研究通过对2018年至2025年间发表在Scopus和Web of Science数据库中的相关研究进行系统性文献回顾(SLR),探讨了应用于专利文档的文本挖掘方法。共分析了117篇科学论文和会议论文,从而确定了以下关键主题:(1)专利文本挖掘的趋势;(2)预处理和分析的主要方法及推荐工具;(3)实际应用中的影响与局限性评估。作为一项实践性和管理方面的贡献,该文献回顾总结了该领域的主要方法进展和新兴趋势,并综合了经过验证的方法中的关键建议,以指明未来的研究方向。通过分析专利文档的文本内容,可以提取出解决实际问题的科学技术知识,这些知识有助于提升竞争优势和制定战略决策,最终成为实现2030年可持续发展议程(SDGs)目标的重要工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号