
-
生物通官微
陪你抓住生命科技
跳动的脉搏
从专利文献中提取文本信息:系统综述
《Management Review Quarterly》:Mining textual fields from patent documents: systematic review
【字体: 大 中 小 】 时间:2025年09月27日 来源:Management Review Quarterly 9
编辑推荐:
专利数据库作为技术情报源,文本挖掘在处理数据量大、结构复杂及多语言半结构化文本时面临挑战。本研究通过系统文献综述分析2018-2025年间117篇专利文本挖掘研究,总结三大主题:技术趋势、预处理与分析方法工具、应用场景与局限,为SDGs战略决策提供支持。
专利数据库是获取技术情报的主要来源,能够提供关于各个领域最新和新兴技术的见解。文本挖掘在提取这些情报方面发挥着重要作用,然而这一过程由于数据量庞大、专利文本结构复杂以及专利文本的独特特性(包括法律与技术语言的结合、多语言内容以及半结构化数据格式)而变得相当复杂。本研究通过对2018年至2025年间发表在Scopus和Web of Science数据库中的相关研究进行系统性文献回顾(SLR),探讨了应用于专利文档的文本挖掘方法。共分析了117篇科学论文和会议论文,从而确定了以下关键主题:(1)专利文本挖掘的趋势;(2)预处理和分析的主要方法及推荐工具;(3)实际应用中的影响与局限性评估。作为一项实践性和管理方面的贡献,该文献回顾总结了该领域的主要方法进展和新兴趋势,并综合了经过验证的方法中的关键建议,以指明未来的研究方向。通过分析专利文档的文本内容,可以提取出解决实际问题的科学技术知识,这些知识有助于提升竞争优势和制定战略决策,最终成为实现2030年可持续发展议程(SDGs)目标的重要工具。
专利数据库是获取技术情报的主要来源,能够提供关于各个领域最新和新兴技术的见解。文本挖掘在提取这些情报方面发挥着重要作用,然而这一过程由于数据量庞大、专利文本结构复杂以及专利文本的独特特性(包括法律与技术语言的结合、多语言内容以及半结构化数据格式)而变得相当复杂。本研究通过对2018年至2025年间发表在Scopus和Web of Science数据库中的相关研究进行系统性文献回顾(SLR),探讨了应用于专利文档的文本挖掘方法。共分析了117篇科学论文和会议论文,从而确定了以下关键主题:(1)专利文本挖掘的趋势;(2)预处理和分析的主要方法及推荐工具;(3)实际应用中的影响与局限性评估。作为一项实践性和管理方面的贡献,该文献回顾总结了该领域的主要方法进展和新兴趋势,并综合了经过验证的方法中的关键建议,以指明未来的研究方向。通过分析专利文档的文本内容,可以提取出解决实际问题的科学技术知识,这些知识有助于提升竞争优势和制定战略决策,最终成为实现2030年可持续发展议程(SDGs)目标的重要工具。
生物通微信公众号
知名企业招聘