
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能专利检索新方法:基于AI分类器的技术创新识别与可重复性研究
【字体: 大 中 小 】 时间:2025年08月28日 来源:World Patent Information 1.9
编辑推荐:
推荐:本研究针对传统专利检索方法在人工智能(AI)技术领域存在的透明度低、可重复性差等问题,提出了一种基于AI分类器的新型专利检索方法。通过构建形式化技术定义和术语框架,开发了自动化专利检索技术,显著提高了AI相关专利识别的精确性和可重复性,为专利研究和统计分析提供了可靠工具。
在当今技术爆炸式发展的时代,人工智能(AI)专利数量呈指数级增长,但如何准确识别和分类这些专利却成为困扰研究人员的难题。传统专利检索方法依赖关键词和专利分类索引,存在透明度低、可重复性差、需要大量人工后处理等缺陷。特别是在AI这种快速发展的新兴技术领域,术语体系尚未统一,传统方法更显得力不从心。Aleksei L. Kalinichenko和Kelvin W. Willoughby在《World Patent Information》发表的这项研究,正是为了解决这一系列问题。
研究人员首先系统分析了现有专利检索方法的局限性:传统工具如关键词搜索和专利分类(CPC/IPC)存在灵活性差、准确性低的问题;而基于学习算法的AI检索方法又往往缺乏明确的边界定义。更严重的是,现有方法大多无法重现已发表的研究结果,严重影响了专利研究的科学性和可靠性。为此,研究团队开发了一种全新的专利检索方法,将形式化技术定义与AI分类器训练相结合,实现了专利检索的自动化、透明化和可重复化。
研究采用了Cipher.ai系统作为训练平台,通过多轮迭代对话构建训练数据集。关键技术方法包括:(1)建立形式化的AI系统定义作为相关性标准;(2)开发专利检索规范,明确分析算法;(3)利用机器学习算法训练专利分类器;(4)通过精确度(precision)和召回率(recall)评估系统性能。研究样本来源于全球专利数据库,重点关注AI技术领域的专利文献。
研究结果部分,作者首先通过文献综述系统比较了传统检索工具与AI检索技术的优劣。在"训练搜索算法的过程"部分,详细描述了如何通过人机对话构建操作定义,并强调了形式化定义对提高检索质量的关键作用。"开发训练数据选择的相关性标准"部分提出了六项定义要求:精确性、全面性、技术特征明确性、范围匹配性、系统类型特征性和结构元素可分类性。
在"专利检索过程"部分,研究展示了新旧方法的对比效果。未采用新方法时,检索结果存在大量模糊边界案例,分类困难;而采用基于形式化定义的新方法后,检索准确性和效率显著提高。作者特别提出了AI系统和机器学习过程的操作定义:AI系统被定义为"根据算法执行操作的硬件、软件和数据集合,其中算法至少部分通过从训练数据中提取行为模式而形成";机器学习过程则被明确定义为"从训练数据中提取行为模式以形成系统操作算法的过程"。
讨论部分指出,这项研究的主要贡献在于:(1)开发了结合技术领域深度分析与AI系统迭代对话的新方法;(2)建立了适用于专利检索的AI技术定义和术语框架。与现有方法相比,新方法兼具传统方法的可形式化优势和AI检索的灵活性,同时解决了二者的关键局限。研究形成的检索规范不仅适用于AI领域,还可推广到其他技术领域的专利研究,特别是那些术语体系尚未成熟的新兴技术领域。
这项研究的科学意义在于:首先,它解决了专利检索领域长期存在的可重复性难题,为专利研究提供了更可靠的方法学基础;其次,提出的形式化定义框架为AI技术领域的专利分析建立了统一标准;最后,开发的方法可以扩展到其他新兴技术领域,具有广泛的应用前景。正如作者所言,这项研究不仅改进了专利检索工具,更重要的是为技术创新的量化研究提供了更科学、更可靠的数据基础。未来,这一方法有望成为专利研究的标准实践,推动技术创新评估进入新阶段。
生物通微信公众号
知名企业招聘