
-
生物通官微
陪你抓住生命科技
跳动的脉搏
大语言模型赋能专利分类:基于AI生成摘要的多语言性能提升研究
【字体: 大 中 小 】 时间:2025年06月18日 来源:World Patent Information 2.2
编辑推荐:
【编辑推荐】针对专利分类中技术术语复杂、多语言处理困难等问题,日本专利局与基尔大学合作开展研究,利用GPT-3.5-turbo生成专利摘要,微调RoBERTa/XLM-RoBERTa模型。实验表明,基于权利要求书和详细说明的AI摘要使USPTO-70k和JPO-70k数据集的F1值提升近3个百分点,为多语言专利自动化管理提供新范式。
专利分类是知识产权管理的核心环节,但面对全球每年数百万份专利申请,人工分类面临巨大挑战。国际专利分类(IPC)体系包含7万余个细分类别,而各国专利局还有自己的分类系统如CPC、FI/F-term等。这些系统需要处理技术术语复杂、句子结构冗长的专利文本,还要应对多语言差异和新技术的持续涌现。更棘手的是,单一专利常需多标签分类,而不同国家对相同专利常给出不同分类结果。
日本专利局的Naoya Yoshikawa与基尔大学Ralf Krestel团队在《World Patent Information》发表研究,创新性地利用大语言模型(LLM)生成专利摘要来提升分类精度。研究采用GPT-3.5-turbo从权利要求书、详细说明等部分生成浓缩文本,再微调RoBERTa和XLM-RoBERTa模型,在英日双语专利数据集USPTO-70k和自建的JPO-70k上进行验证。
关键技术包括:1) 使用LLM对专利文本不同章节生成摘要;2) 构建包含7万组日文专利的JPO-70k新数据集;3) 采用多标签(子类级)和单标签(子组级)双任务评估体系;4) 对比原始摘要与AI摘要的训练效果差异。
【结果与讨论】
研究证实,LLM生成的摘要能有效浓缩专利文本中的分类相关特征,尤其擅长从冗长的详细说明中提取核心技术要素。这种方法不仅缓解了专利文本的信息过载问题,其多语言处理能力更为构建统一的全球专利分类体系提供可能。日本专利局的实践表明,该技术可显著降低分类工作的人力成本,对于应对持续增长的专利申请量具有重要应用价值。未来研究可探索更多语言场景,并进一步优化摘要生成与分类模型的协同机制。
生物通微信公众号
知名企业招聘