语言关联开放数据云的公平性:一项实证研究

《Journal of Data and Information Quality》:FAIRness of the Linguistic Linked Open Data Cloud: an Empirical Investigation

【字体: 时间:2025年11月08日 来源:Journal of Data and Information Quality

编辑推荐:

  LLOD云通过语义网技术构建多语言数据互联生态,但其可访问性、互操作性和重用性面临挑战。本文系统评估2014-2024年间69个LLOD数据集的FAIR合规性,发现仅部分满足可发现性和可访问性标准,开放许可使用不足且互链稀缺。提出的质量维度映射框架为优化数据合规性提供结构化方案。

  

摘要

语言链接开放数据(LLOD)云已成为语言研究的基石,促进了数据集的共享和数据的再利用。通过利用语义网技术,LLOD提供了一个由相互关联的语言数据集构成的丰富体系,为语言学和自然语言处理的进步奠定了基础。然而,这一生态系统面临着数据可访问性、互操作性和再利用方面的挑战。本文评估了LLOD数据集是否符合FAIR原则(即可发现性、可访问性、互操作性和可重用性),以评估其质量。
本文进行了一项系统的文献回顾,确定了过去十年(2014-2024年)使用语义网技术发布的69个语言数据集。这些数据集通过KGHeartBeat这一自动化框架进行了评估,该框架用于评估链接数据的质量。分析重点关注了FAIR原则与质量维度(包括可访问性和可信度)之间的对应关系,发现LLOD数据集在可发现性和可访问性方面仅部分符合要求,数据之间的链接较少,且开放许可证的使用也较为有限,这限制了数据的广泛再利用。更详细地说,本文提出的映射方法是一种新颖且可行的质量维度与FAIR原则之间的对应关系,为提高数据集的合规性提供了结构化的框架。研究结果强调了提高数据可访问性、加强数据链接以及更广泛采用开放许可证的必要性,以最大化LLOD在研究和应用中的价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号