
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:医疗保健领域数据质量评估的维度、方法与工具:一项系统性回顾
【字体: 大 中 小 】 时间:2025年08月10日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
这篇综述系统回顾了医疗数据质量评估(DQA)的关键维度(DQDs)、评估方法及工具,重点探讨了完整性(completeness)、合理性(plausibility)和一致性(conformance)等核心维度,提出了基于规则系统、统计方法和外部金标准等多元化评估策略,为临床决策和医学研究的数据可靠性提供了实用框架。
数据质量(DQ)作为多维度概念,其定义随应用场景变化。世界卫生组织(WHO)将其定义为"系统通过合法手段实现目标的能力",而美国医学信息协会(AMIA)强调高质量数据对临床决策、患者结局和医学研究的核心价值。随着电子健康记录(EHR)和注册数据的爆炸式增长,数据质量评估(DQA)面临术语不统一、方法异质性等挑战。
采用PRISMA指南系统检索PubMed、Web of Science和Scopus数据库截至2024年的文献,纳入44项研究。通过双盲筛选和第三方仲裁,提取数据质量维度(DQDs)、评估方法和工具三大要素,构建证据热图展示其关联性。质量评估采用0-1分制标准(QAC),整体研究质量达67%,超过60%的合格阈值。
数据质量维度
分析揭示DQDs存在显著术语差异:
完整性(93%研究涉及):通过缺失字段比率、时间趋势分析等评估
合理性(49%):检查数据间逻辑关联与生物可信度
一致性(26%):验证数据格式与预定义标准的符合度

评估方法
呈现技术梯度:
基础方法:字段完成率公式(如(完成字段数/总字段数)×100%)
进阶方法:规则数据库(32%)、统计检验(29%)
创新方法:AI驱动模式分析(<5%),如自然语言处理(NLP)评估非结构化文本
工具开发现状
55%研究开发专用工具,主要类型:
R/Python工具包(41%):如DQD仪表盘、mosaicQA库
SQL规则引擎(17%):适配PCORnet通用数据模型(CDM)
网络应用(17%):TAQIH支持非技术人员参与DQA

研究提出三维应用建议:
维度选择:优先评估完整性作为基础维度,再验证合理性等衍生维度
方法适配:观察性研究推荐Kahn框架的三维度评估,临床试验需增加准确性验证
工具选型:多中心研究宜采用FHIR标准工具如daqapo,单中心可用轻量级R包
亟待解决术语标准化问题,建议建立类似OMOP CDM的DQD通用模型。探索AI与人类协同的混合评估模式,开发支持实时质量反馈的智能系统,将是突破数据质量瓶颈的关键路径。
生物通微信公众号
知名企业招聘