癌症登记系统实时数据自动化提取验证:电子健康记录(EHR)整合模型的精准性与可行性研究

【字体: 时间:2025年07月18日 来源:iScience 4.6

编辑推荐:

  本研究针对传统癌症登记系统人工数据提取效率低下的问题,开发了基于通用数据模型(Datagateway)的自动化EHR数据提取系统。通过验证急性髓系白血病(AML)、多发性骨髓瘤(MM)、肺癌和乳腺癌患者数据,证明该系统诊断识别准确率达100%,治疗方案提取准确率95%,实验室数据匹配近乎完美。该研究为实时肿瘤学真实世界数据(RWD)采集提供了标准化解决方案,对提升癌症登记效率具有里程碑意义。

  

在癌症诊疗快速发展的今天,传统基于人工录入的肿瘤登记系统面临严峻挑战。荷兰癌症登记处(NCR)作为覆盖全国95%新发肿瘤病例的权威数据库,每年需处理13万份病例,但人工录入存在9-12个月的滞后性,难以满足实时疗效评估和药物安全监测的需求。更棘手的是,随着靶向治疗和免疫治疗的普及,治疗方案日益复杂化,人工记录组合用药方案(如多发性骨髓瘤的三联/四联疗法)的出错率高达3%,而治疗毒性事件(如侵袭性曲霉病)的识别准确率波动在0-100%之间,这些数据缺口严重制约了真实世界证据(RWE)的可靠性。

Performation Healthcare(荷兰泽斯特)联合荷兰综合癌症组织(IKNL)的研究团队在《iScience》发表了一项突破性研究。他们开发的Datagateway系统创新性地采用健康等级7快速医疗互操作性资源(HL7 FHIR)标准,构建了能兼容EPIC、HiX和Nexus三大电子健康记录(EHR)系统的通用数据模型(CDM)。该系统通过结构化查询语言(SQL)实现自动化数据抓取,每日更新实验室参数、用药方案等关键字段,并利用解剖治疗化学(ATC)编码体系实现跨机构治疗方案标准化归类。

关键技术方法包括:1) 基于ICD-10编码的自动化病例筛选;2) 通过FHIR接口实现EHR多源数据整合;3) 组合用药时序分析算法(周级时间窗匹配);4) 治疗毒性双轨验证机制(处方指标+入院诊断)。研究队列涵盖1,804例患者(AML 517例,肺癌1,154例,MM 117例,乳腺癌16例),数据来自荷兰多家医疗中心2018-2024年临床记录。

【验证新诊断】

前瞻性验证显示,系统对NCR纳入标准符合率达95%(1,219/1,287例),5%误差主要来自复发患者误判(40%)和未确诊病例(44%)。回顾性验证中,Datagateway成功召回NCR全部登记病例,89%患者诊疗时间轴完全匹配。

【治疗方案验证】

AML治疗方案的识别实现100%准确率(254例验证)。MM复杂方案识别中,抗CD38疗法(如达雷妥尤单抗)准确率96%(53/55例),但来那度胺-地塞米松(Rd)方案存在剂量误判(15mg维持剂量被归类为标准Rd)。值得注意的是,双特异性抗体疗法(如teclistamab)和CAR-T细胞治疗均实现100%精准抓取。

【实验室数据】

与TIBET试验人工记录对比,2,315项实验室参数仅7项(0.42%)存在差异,均为人工录入笔误。肿瘤标志物如CA15-3等数值完全一致,证实自动化提取的可靠性。

【治疗毒性】

ICU入住(100%)、急性肾损伤(100%)等指标表现完美,但肺毒性识别准确率为0%——因影像报告关键词匹配失效。创新性地采用入院诊断补充后,侵袭性真菌感染识别率提升至87%(曲霉病)和100%(念珠菌病),肠壁炎(typhlitis)的复合识别准确率提升至72%。

这项研究确立了自动化EHR数据整合在癌症登记中的金标准:诊断字段可直接用于NCR录入(100%准确),治疗方案需人工复核3%复杂组合用药,而治疗毒性监测需结合自然语言处理(NLP)技术升级。尤为重要的是,该系统使癌症登记周期从年缩短至天,为奥西替尼等靶向药的实时疗效评估提供了可能。研究者特别指出,未来需开发基于OMOP-CDM的跨國数据池,以解决小癌种(如研究中的16例乳腺癌)样本不足问题。正如讨论部分强调的,这项技术不仅改变了荷兰癌症监测模式,其FHIR标准化框架更为全球癌症登记系统升级提供了可复制的技术蓝图。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号