阿尔茨海默病研究中心统一数据集与FHIR和CDISC标准的映射分析:推动电子健康记录数据互操作性与临床研究整合的新视角

【字体: 时间:2025年09月11日 来源:Alzheimer's & Dementia 11.1

编辑推荐:

  本综述系统评估了阿尔茨海默病研究中心统一数据集(ADRC UDS)与健康 Level 7(HL7)快速医疗互操作性资源(FHIR)和临床数据交换标准联盟(CDISC)标准之间的对齐程度。研究表明,94%的UDS数据元素可映射至CDISC标准,而仅有45%可映射至FHIR标准,揭示了电子健康记录(EHR)在痴呆研究中的数据提取潜力与局限性,为促进真实世界数据(RWD)在神经退行性疾病研究中的标准化应用提供重要依据。

  

背景

近年来,数据共享与再利用在生物医学研究中的重要性日益凸显。美国国立卫生研究院(NIH)于2023年1月实施的数据管理与共享政策,以及监管机构对真实世界数据(RWD)在治疗决策中应用的关注,都推动了对数据标准化体系的深入探索。阿尔茨海默病及相关痴呆症(ADRD)研究涉及多场景数据收集,其中阿尔茨海默病研究中心(ADRC)项目通过国家阿尔茨海默病协调中心(NACC)的统一数据集(UDS)实现了超过30年的纵向临床数据、认知评估、影像学与生物样本的系统整合。随着Aducanumab和Lecanemab等新型治疗药物的批准上市,对上市后安全性监测与疗效评估的需求进一步凸显了UDS数据在真实世界证据生成中的价值。

当前,医疗健康领域主要存在两大数据标准体系:一是主要用于医疗系统互操作的HL7 FHIR标准,其设计目标为实现电子健康记录(EHR)系统间的数据交换;二是由临床数据交换标准联盟(CDISC)制定的研究数据表格模型(SDTM),该标准被广泛应用于制药行业的临床研究数据提交至监管机构(如美国FDA)。值得注意的是,CDISC还专门发布了阿尔茨海默病治疗领域用户指南(TAUG),以支持该领域的数据标准化工作。尽管先前研究已证实基于FHIR的eSource解决方案在临床研究中的可行性,但不同标准体系在ADRD研究中的兼容性与差异性尚未得到系统评估。

方法

本研究采用系统化映射方法,对ADRC UDS中的5,959个数据元素进行标准化映射分析。这些数据元素来源于11个数据包,包括初始访视包(IVP)、随访访视包(FVP)、电话初访包(TIP)、电话随访包(TFP)以及针对额颞叶变性(FTLD)和路易体痴呆(LBD)的特异性模块。研究人员排除了不属于常规EHR数据收集范围的表格元素(如表格清单和页眉页脚信息)。

映射过程由两名独立评审员分别执行,首先将每个UDS数据元素分为“可映射”或“不可映射”两类,随后对可映射元素进行具体的资源或域变量匹配。针对FHIR标准,映射仅采用成熟度等级≥3的资源;对于CDISC标准,则依据SDTM模型3.2版本及其相关治疗领域指南。评审员间的一致性通过计算相同映射结果的数据元素比例进行评估,差异部分由至少具有5年标准实施经验的专家进行裁决。

结果

FHIR映射结果

分析显示,UDS主要数据包(IVP、FVP、TIP、TFP和UDS4)的FHIR映射率在46%至50%之间,评审员间一致性达到88%。值得注意的是,FTLD数据包的映射率显著较低(19%-22%),而COVID数据包则完全无法映射(0%)。表型分析表明,UDS3 IVP的整体映射率为50%,其中药物信息(A4表格)映射率高达99%, demographics(A1)和家族史(A3)分别达到56%和69%,而行为评估(B5、B6、B7)和神经心理学量表(C2)则完全无法映射。

在FHIR资源分布方面,Observation(35%)、Condition(28%)、MedicationStatement(17%)和DiagnosticReport(7%)成为最主要的映射资源,共覆盖87%的可映射元素。这些资源主要对应UDS中的健康史、医疗状况、药物信息和诊断问卷等模块。此外,Patient资源及其扩展(如US Core Race Extension)用于人口统计学数据,FamilyMemberHistory和RelatedPerson资源则用于家族史信息。

CDISC映射结果

与FHIR相比,CDISC表现出显著更高的映射兼容性。UDS主要数据包的映射率达到92%-94%,其中LBD和M1数据包更达到100%的完全映射。整体而言,94%的UDS数据元素可映射至CDISC标准,评审员间一致性高达98%。

详细分析显示,UDS3 IVP的CDISC映射率为93%,其中药物信息(A4)、行为功能评估(B5、B6、B7)和医疗状况(D2)均达到100%映射。UDS4的映射率同样达到92%,在药物、评估量表和生物标志物(D1b)等领域保持完美映射记录。

在CDISC域分布方面,Associated Person(AP)域占比最高(26%),其次为Questionnaire(QS,21%)、Findings About Event(FA,18%)、Functional Tests(FT,6%)和Medical History(MH,6%)。这些域共同覆盖了UDS数据的主要内容,体现了CDISC标准在临床研究数据表征方面的全面性。

讨论

本研究通过系统化映射分析,揭示了ADRC UDS数据与HL7 FHIR和CDISC标准之间的对齐特征与差异。45%的FHIR映射率表明,近半数UDS数据元素可能从EHR系统中直接获取,这为利用真实世界数据支持ADRD研究提供了可能。然而,这一比例也反映了FHIR标准在研究特定数据捕获方面的局限性,特别是在行为量表、神经心理学评估等专业化研究工具方面。

CDISC标准94%的映射率则体现了其作为临床研究数据标准的优势。该标准最初为临床试验数据提交而设计,其结构能够更好地容纳各种类型的研究数据,包括标准化问卷和定制化评估工具。值得注意的是,CDISC通过受控术语库(如NCI-EVS)和补充限定符(SuppQual)机制,能够灵活处理UDS中的复杂数据元素,甚至在需要时通过派生变量实现语义层面的等价映射。

在术语体系方面,FHIR依赖于ICD、SNOMED CT等临床编码系统,而CDISC则采用自建的受控术语体系。这种差异在数据映射过程中需要进行术语协调,增加了语义互操作的复杂性。

研究还发现,某些映射存在粒度不匹配问题。例如,UDS中关于吸烟史的详细分类(如“是否吸烟超过100支”)在CDISC中需要通过Substance Use域变量(SUDOSFRQ、SUENDAT等)进行派生处理。同样,医疗状况的时间特征(“近期活动性”与“远期非活动性”)在FHIR中需要通过Condition资源的onset和abatement时间属性进行推断映射。

研究的局限性包括映射过程的主观性、时间维度对齐的挑战(UDS年度访视与CDISC可能采用的18个月间隔之间的差异),以及EHR数据质量对实际数据提取效果的影响。此外,FHIR标准的持续演进(如ResearchSubject和ResearchStudy资源的成熟度提升)可能改善未来对研究数据的支持能力。

结论

本研究首次系统评估了ADRC UDS与FHIR和CDISC标准之间的对齐程度,为促进ADRD研究数据的跨系统流动与整合提供了重要依据。CDISC标准展现出对UDS数据的高度兼容性,支持其作为研究数据交换与聚合的有效标准。FHIR标准虽然目前覆盖范围有限,但其在EHR数据直接提取方面的潜力为未来实现临床护理与研究之间的无缝数据流动指明了方向。

随着FDA对阿尔茨海默病治疗药物上市后安全性监测要求的加强,以及真实世界证据在监管决策中作用的提升,标准化数据的互操作性与整合利用将变得愈发重要。本研究为建立ADRD领域的数据标准 harmonization 策略提供了实证基础,也为其他疾病领域的数据标准对齐研究提供了可借鉴的方法学框架。

未来的研究方向应包括:提升FHIR资源对研究特定数据元素的支持能力;开发EHR中研究问卷的标准化集成方案;探索时序数据对齐与质量保证方法;以及研究标准化数据对ADRD临床试验加速和真实世界证据生成的实际影响。通过持续的标准优化与实施实践,有望最终实现临床护理、研究注册和监管提交之间的数据无缝流动,推动神经退行性疾病研究的创新发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号