基于FHIRPath的FHIR数据表格化视图标准化研究:实现跨平台医疗数据分析互操作性

【字体: 时间:2025年06月10日 来源:npj Digital Medicine 12.4

编辑推荐:

  这篇综述创新性地提出了"SQL on FHIR"视图定义规范,通过FHIRPath表达式实现医疗数据(FHIR)到表格结构的标准化转换。研究团队历时18个月开发出兼容多种技术平台(如Spark、PostgreSQL)的解决方案,成功复现了ICU氧疗种族差异研究,证实其在大规模临床数据分析中的可行性。该规范采用三层架构(数据层-视图层-分析层),支持select/forEach等指令,显著提升了医疗互操作性标准(FHIR)在实时分析(CDSS)、预测建模等场景的应用效率。

  

Abstract

医疗数据互操作性标准FHIR(Fast Healthcare Interoperability Resources)在分析领域面临复杂数据结构转换和JSON/XML查询性能等挑战。国际工作组开发的新型规范通过FHIRPath定义表格视图,经多平台验证可实现:1)跨技术栈执行相同视图定义;2)保留FHIR语义的同时提升分析效率;3)通过MIMIC-IV数据集复现ICU氧疗种族差异研究,证实结果一致性。

Introduction

FHIR作为现代医疗互操作标准,其模块化资源设计相比OMOP CDM更侧重实时数据交换。尽管被ONC"21世纪治愈法案"和欧盟EHDS强制采用,但嵌套的JSON/XML结构导致:1)可视化困难;2)分析工具兼容性差;3)查询性能瓶颈。现有方案如原始SQL on FHIR、FML等存在实现复杂或可移植性差的问题。

Results

Specification

规范采用三层架构:

  • 数据层:支持REST API、NDJSON等多种FHIR存储
  • 视图层:通过select(定义列)、forEach(行展开)等指令实现转换
  • 分析层:输出兼容SQL/R/Python等工具

关键创新包括:

  1. 使用FHIRPath表达式提取数据,支持getResourceKey()生成连接键
  2. 提供base/shareable/tabular三级规范,约束程度递增
  3. 通过unionAll合并查询结果,forEachOrNull实现外连接语义

Implementations

8个独立实现验证可行性:

  • Pathling:转译为Spark SQL
  • Aidbox:基于PostgreSQL实现
  • 谷歌FHIR Data Pipes:适配多种数据仓库
    测试显示在4600万条MIMIC-IV观察记录中保持稳定性能。

Study replication

复现Gottlieb等关于ICU氧疗种族差异研究:

  1. 亚洲患者接受率低22%(p<0.001)
  2. 非裔患者低19%
  3. 西班牙裔低15%
    结果在Pathling/Spark和Aidbox/PostgreSQL双平台完全一致。

Discussion

与CQL、FML等方案对比显示:

  • 表达力3/5 vs CQL的5/5
  • 易用性4/5 vs FML的2/5
  • 可移植性5/5最佳

局限包括单资源约束和单向转换,但换取了:

  1. 与现有分析工具无缝集成
  2. 降低70%自定义转换代码量
  3. 支持Bulk Data API等新兴标准

未来将拓展Parquet格式支持和OMOP CDM映射,为FHIR-based AI(EHRMamba等)提供标准化数据管道。规范已获HL7官方工具集成,正在改变临床研究(如Cumulus项目)的数据准备范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号