超越首页的内容:将专利作为引文嵌入正文,以揭示发明者的知识背景
《STRATEGIC MANAGEMENT JOURNAL》:Beyond the front page: In-text citations to patents as traces of inventor knowledge
【字体:
大
中
小
】
时间:2025年10月23日
来源:STRATEGIC MANAGEMENT JOURNAL 7.2
编辑推荐:
专利内文引用作为知识流动的新数据源,其地理集聚性、语义相关性及发明者主导特征显著优于传统前页引用。研究发现,内文引用更集中于发明者所在地,语义相似度达0.80,且22.46%的引用存在共同发明者或 Assignee,较前页引用高出16个百分点。通过复制知识扩散经典研究,证实内文引用能更精准捕捉技术关联,特别是在长距离知识流动中,其衰减幅度较前页引用低17%-44%。公开数据集和代码为后续研究提供基础。
这项研究探讨了专利文献中“正文引用”作为一种新颖的数据来源,用于追踪知识流动。与传统的“专利首页引用”不同,后者往往反映法律要求,正文引用更有可能源自发明人,表明有意义的技术关联。研究发现,正文引用在地理接近性、语义接近性和发明人知识匹配方面表现更为突出,尽管它们的频率低于首页引用,但在知识扩散模型中仍能产生稳健的结果。我们发布了一个经过验证的数据集和可复现的代码,以支持未来的研究。研究结果为学者提供了新的机会,帮助他们理解创新的微观基础、知识流动的地理特征以及发明人在塑造企业知识轨迹中的作用。
研究强调,专利首页引用常常受到发明人影响有限,因为这些引用由专利审查员决定,或在申请过程中被发明人、公司内部律师或外部律师提供。相比之下,正文引用更可能反映发明人的知识,因为它们在技术描述中直接嵌入,且更多地与发明人的知识体系相关。通过调查专利律师,研究发现正文引用更有可能源自发明人,而不是申请人或律师。这些结果表明,正文引用能够提供一个更清晰的视角,以理解知识是如何在发明人和企业之间流动的。
此外,研究还评估了正文引用在实际应用中的价值,通过复制Balsmeier等人的研究(2023年),进一步验证了其在知识扩散分析中的可靠性。虽然正文引用的数量较少,但它们的稀缺性并不意味着不足。复制结果显示,正文引用能够产生统计上显著的结果,即使在有限的样本条件下也是如此。这表明,正文引用可以成为追踪知识流动的有力工具。
为了系统验证正文引用数据集,我们使用开源的机器学习解析器来识别专利文献中的引用,并测量其精确度和召回率,记录残余误差模式,并发布完整的可复现工作流程。我们的公开代码能够清理解析器的原始输出,区分引用字符串,并将其映射到标准化的专利编号,为学者提供一个透明、可审计的研究基础。数据集涵盖了近800万份独特的专利文档,其中包含4950万条正文引用,数据覆盖从1976年开始。
正文引用在地理分布、语义相似性以及引用类型方面都展现出独特的优势。通过分析,我们发现正文引用比首页引用更加集中,且在语义上更接近。此外,它们在知识来源上也更具自我指向性,更多地指向发明人所在企业或发明人先前的发明。这种特征表明,正文引用可能比首页引用更能反映发明人知识的传播路径。研究还通过调查专利律师,发现正文引用在随机选择时,有19%到44%的可能性源自发明人,而首页引用则有更小的可能性。这一结果支持了正文引用作为知识流动指标的潜力。
从技术层面来看,正文引用在专利文献中扮演着重要的角色。它们不仅用于满足专利法中关于新颖性和非显而易见性的要求,还用于展示发明的可实施性。通过引用早期专利或科学文献,发明者能够帮助读者理解技术细节,从而增强专利的法律有效性。此外,这些引用有时还用于说明发明的实用性,通过实际应用案例来证明其价值。这些引用虽然可能不会在首页引用中出现,但它们在专利文本中具有更明确的技术意义,有助于更准确地反映发明者的知识基础。
研究进一步发现,正文引用在地理分布上比首页引用更为集中。例如,当分析发明人和被引用发明人之间的地理距离时,正文引用显示出更高的局部性。这种趋势表明,发明人更倾向于在专利文本中引用与自己工作和居住地相关的技术,这可能意味着正文引用更直接地反映发明人的知识来源。相比之下,首页引用由于审查员的决定,可能包含更多非本地的技术文献,导致其在地理分布上更为分散。
此外,研究还比较了正文引用与首页引用在语义上的相似性。通过计算专利文本之间的相似度,研究发现正文引用的相似度显著高于首页引用。这种更高的相似度表明,正文引用可能更紧密地连接相关技术,从而更好地反映发明人之间的知识流动。图示显示,正文引用的分布峰值偏向于更高的相似度,表明它们在技术关联性上更强。这一发现进一步支持了正文引用作为知识流动指标的有效性。
在自我引用方面,正文引用显示出更高的比例。研究发现,17.43%的正文引用至少包含一名共同发明人,而首页引用的这一比例仅为5.98%。这表明,正文引用更可能反映发明人之间知识的重复使用,而非仅仅为了满足法律要求。自我引用在知识创造研究中具有重要价值,例如用于测量知识继承或知识继承的强度。因此,正文引用可能为研究企业内部的知识动态提供新的视角。
研究还通过调查专利律师,发现他们普遍认为正文引用更可能源自发明人。这表明,正文引用在技术叙述中具有更高的信息价值,能够更准确地反映发明人的知识来源。这种观点支持了正文引用作为知识流动的有力工具。此外,研究还发现,正文引用在科学文献中的比例也较高,但其对知识流动的反映强度略弱于专利引用。
总的来说,这项研究揭示了正文引用作为知识流动指标的潜力。它们不仅在地理分布、语义相似性和自我引用方面表现优异,还能提供更清晰的知识流动信号。尽管首页引用在数量上更为丰富,但其作为知识扩散的代理指标存在显著的噪声。相比之下,正文引用虽然数量较少,但其稳健性和信息丰富性使其在知识流动分析中具有重要价值。研究结果为学者提供了新的研究方向,包括对知识流动的进一步分析、专利引用的扩展应用以及对引用上下文的深入研究。
此外,研究还指出,专利文献中的引用可以为理解创新的微观基础提供新的视角。通过分析正文引用,学者能够更深入地了解发明人在技术开发过程中的知识来源,以及这些知识如何在企业内部和外部流动。这不仅有助于改进现有的知识扩散模型,还可能为未来的研究提供新的方法论支持。
研究还强调,正文引用能够为分析企业战略行为提供新的数据支持。例如,通过比较不同企业的引用模式,可以揭示企业在技术开发过程中的合作与竞争动态。此外,研究还指出,正文引用可以用于评估专利的影响力,包括技术突破、专利重要性等。这为专利评估提供了新的方法论基础。
最后,研究提出了一些未来的研究方向,包括进一步分析正文引用的上下文、扩展其在知识流动研究中的应用,以及探索其与其他专利指标的关联性。这些方向为学者提供了新的研究机会,有助于更全面地理解创新的微观基础和知识流动的动态特征。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号