基于本体的模式级数据质量:以一致性为例
《Journal of Data and Information Quality》:Ontology-Based Schema-Level Data Quality: The Case of Consistency
【字体:
大
中
小
】
时间:2025年11月08日
来源:Journal of Data and Information Quality
编辑推荐:
元数据质量是数据FAIR化的核心,基于本体数据管理(OBDM)提出新框架,聚焦数据库模式完整性约束与知识本体的一致性验证,解决约束严格性评估的计算问题并证明其可解性。
摘要
元数据的质量在许多数据公平性(FAIRification)过程中起着至关重要的作用。事实上,数据公平性的四大主要原则都要求使用高质量的元数据。
在基于本体(Ontology-Based)的数据管理(OBDM)这一主要的数据管理范式中,元数据被视为核心要素。OBDM的目标是通过包含本体和映射的语义元数据层,为用户提供一组异构数据源的统一视图。本体是对感兴趣领域的高层次、声明性表示,用逻辑理论的形式编写;而映射则描述了本体中的符号与数据源中数据之间的关系。
在本文中,我们提出了一个基于OBDM的新的数据质量框架,专门用于元数据分析。该框架针对的是目前最常见的一种元数据形式——即由数据库模式定义的完整性约束。具体来说,我们关注的是“一致性”这一数据质量维度,即数据不存在矛盾和不一致性的特性。在此框架下,我们提供了一套工具,用于将数据库模式定义的完整性约束与本体中编码的知识进行比较,以判断这些约束是否足够严格(即能够有效保护数据),同时又不会过于严格(即不会违背本体的含义)。
本文的贡献在于提出了该框架,并研究了相关的计算问题。我们将对这类问题进行详细的计算复杂性分析,证明对于实践中广泛使用的OBDM规范和完整性约束类别,这些问题是可判定的。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号