将护理文档数据转换为Observational Medical Outcomes合作伙伴的通用数据模型
《International Journal of Medical Informatics》:Transforming nursing documentation data into the Observational Medical Outcomes partners common data model
【字体:
大
中
小
】
时间:2026年02月18日
来源:International Journal of Medical Informatics 4.1
编辑推荐:
本研究将护理文档数据标准化为OMOP CDM格式,并利用标准化数据生成恶心症状患者队列,验证标准化的有效性。通过SNOMED CT映射,98.9%的护理记录被成功转换,生成214,830例恶心患者队列,远超基于诊断和主诉的12,381例队列,显示标准化显著提升数据利用效率。
郑惠实(Hyesil Jung)| 尤秀英(Sooyoung Yoo)| 金硕赫(Seok Kim)| 郑智海(Jeehae Chung)| 李浩英(Ho-Young Lee)
韩国仁荷大学护理学院
摘要
背景
电子健康记录(EHR)为观察性研究提供了临床证据。其中,护理记录数据反映了患者的问题或状况以及护理服务,这些信息在其他数据源中是无法获得的;然而,由于护理记录的质量较低,它们在研究中并未得到充分利用。
目的
本研究的目标是:1)将护理记录数据转换为观察性医疗结果合作伙伴关系(OMOP)通用数据模型(CDM)格式;2)利用转换后的护理记录数据生成一个恶心症状住院患者队列,以展示标准化的效果。
方法
从韩国某大都会地区的一家三级综合医院的电子健康记录中提取了4,006条独特的护理记录语句。这些语句主要使用OMOP词汇表之一——系统化医学术语临床术语(SNOMED CT),根据映射原则和指南进行了标准化处理。将数据转换为OMOP CDM格式后,利用与“恶心”、“恶心护理”和“恶心护理教育”相关联的护理记录语句生成了一个恶心症状住院患者队列。随后,我们将该队列的规模和人口统计特征与基于恶心诊断和主诉生成的队列进行了比较。
结果
在4,006条独特的护理记录语句中,98.9%被映射到SNOMED CT概念中。总计有来自2,537,310例患者的近2亿条护理记录语句被标准化并转换为OMOP CDM数据。这些数据根据各自的映射领域存储在observation、procedure_occurrence和measurement表中。在2003年5月至2022年12月的住院病例中,使用标准化护理记录语句生成的恶心症状队列包含214,830例患者,而基于恶心诊断和主诉生成的队列包含12,381例患者。
结论
据我们所知,这是首次将护理记录数据转换为OMOP CDM格式的研究。作为后续研究,有必要将本研究中建立的标准化和原则推广到参与OMOP CDM项目的其他机构。
引言
电子健康记录数据(包括电子医疗记录)通常被重新用于行政和研究目的。电子健康记录为观察性研究提供了临床证据。然而,不同国家和机构之间的数据结构和词汇表存在差异,这给多中心观察性研究的开展带来了障碍[1]。因此,人们努力以一致和标准化的方法对来自多个中心的数据进行标准化,从而确保语法和语义上的互操作性,并便于进行比较和分析[2]。
观察性健康数据科学与信息学(OHDSI)社区利用观察性医疗结果合作伙伴关系(OMOP)通用数据模型(CDM)来标准化来自多个或不同数据源的异构数据结构和词汇表。研究人员可以通过OMOP CDM一致地分析来自多个站点或来源的数据,并共享分析方法和结果,而无需交换患者级别的信息[3]。2015年至2024年间,发表了700多篇关于OMOP CDM的文章,包括将本地登记数据转换为OMOP CDM的文章[1]、[4]、[5],或分析OMOP CDM数据以预测特定疾病或事件的风险[6]、[7],以及评估特定治疗方法(如高血压治疗[8]和COVID-19治疗[9]的效果。
同时,护理记录数据反映了患者的问题、护士观察到的状况以及护理行动或服务,不仅是医务人员之间有效沟通的手段,也是提高患者护理质量的资源[10]。这些数据包含了关于患者状况(如睡眠状态和虚弱)、周围环境(如是否由看护人陪同)以及治疗或干预措施(如防跌倒和禁食)的信息,而这些信息在其他数据源中是无法获得的。然而,由于护理记录的质量较低(包括非结构化的自由文本和数据重复[11]),它们在研究中并未得到充分利用。因此,与其他电子健康记录数据(如诊断、实验室和药物数据)相比,护理记录的标准化工作较少受到关注和投入;OMOP CDM也不例外。
关于将护理数据转换为OMOP CDM的研究较少。代表性的研究包括一项使用OMOP CDM表示已发表的护理研究数据的研究[12],以及一项使用系统化医学术语临床术语(SNOMED CT)对来自医疗机构的6,277条护理记录语句进行标准化处理,然后将其转换为OMOP CDM以开发跌倒风险预测模型的研究[13]。将护理记录数据转换为OMOP CDM将有助于开展多机构患者安全事件(包括跌倒)的研究,因为护理记录数据包含了其他资源所没有的信息[14]。
在此背景下,本研究旨在标准化护理记录数据并将其转换为OMOP CDM。此外,我们还希望通过使用转换为OMOP CDM的护理记录数据生成特定队列,来展示标准化的效果。我们探讨了是否包含转换为OMOP CDM的护理记录数据对队列规模和特征的影响。
方法部分
方法
图1展示了研究过程。首先,从电子健康记录系统中提取护理记录语句,使用OMOP词汇表之一的SNOMED CT进行标准化处理,然后将其转换为OMOP CDM数据并存储。之后,使用OHDSI的ACHILLES工具评估数据质量,并利用转换后的护理记录语句创建具有特定症状的患者队列。
护理记录的语义映射及转换为OMOP CDM
表3展示了护理记录的映射结果。在3,523条没有属性和值的护理记录语句中,有3,479条(98.8%)被转换为OMOP标准化的词汇概念。这些概念包括:条件领域中的459个独特概念、程序领域中的638个独特概念、观察领域中的332个独特概念以及测量领域中的23个独特概念。另有44条护理记录语句未能映射到SNOMED CT中的任何概念。
主要结果
在本研究中,护理记录语句被转换为OMOP CDM以供二次使用,并利用转换后的护理记录语句创建了一个恶心症状患者队列作为试点。使用标准化术语或词汇表可以实现患者数据之间的交换,并在全球范围内进行数据分析[16]。目前OHDSI支持超过100个词汇表;然而,OHDSI已定义了一组用于标准化的词汇表。
结论
护理记录不仅是医务人员之间有效沟通的渠道,也是展示护士对患者结果贡献的基础。因此,必须清晰、准确地记录护理记录,并确保其可访问性[29]。为了便于访问护理记录,需要进行语义和结构上的标准化。从这个角度来看,OMOP CDM是用于标准化电子健康记录数据结构、内容和语义的机制之一。
数据可用性
由于仅描述了现有数据集的映射过程,本研究中生成和/或分析的数据集并未公开发布;但经相应作者同意,可提供更多相关信息。
伦理批准声明
本研究遵循世界医学协会关于涉及人类受试者的医学研究的伦理原则声明进行,并得到了研究医院机构审查委员会的审查和批准(IRB编号:X-2503–961-901)。
CRediT作者贡献声明
郑惠实(Hyesil Jung):撰写——初稿、监督、方法论、资金获取、概念构思。尤秀英(Sooyoung Yoo):撰写——审阅与编辑、验证、资源协调、数据整理。金硕赫(Seok Kim):验证、软件使用、数据整理。郑智海(Jeehae Chung):撰写——审阅与编辑、正式分析。李浩英(Ho-Young Lee):监督、资源协调。利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本项工作得到了韩国政府(MSIT)资助的国家研究基金会(授权号:RS-2024-00459331)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号