面向电子健康记录结构化与偶发性缺失的集成分析方法:Macomss的理论与实践

《Journal of Biomedical Informatics》:Integrated analysis for electronic health records with structured and sporadic missingness

【字体: 时间:2025年10月19日 来源:Journal of Biomedical Informatics 4.5

编辑推荐:

  本文提出了一种针对电子健康记录(EHR)中结构化与偶发性缺失数据的新型插补方法Macomss。该方法通过矩阵补全技术处理异构EHR数据集整合时出现的系统性缺失和随机缺失,兼具理论保证与实证优势。在模拟研究和杜克大学健康系统(DUHS)真实数据验证中,Macomss在插补误差和下游预测性能上均优于现有方法,为人群健康研究的集成分析提供了可靠工具。

  
背景与意义
电子健康记录(EHR)已成为现代医疗的基石,其提供的丰富多维数据支撑着临床决策、科学研究和健康政策制定[1-9]。随着EHR系统的广泛普及,收集数据的规模和多样性显著增长[10,11],为通过集成分析深化人群健康认知创造了巨大潜力。然而...
研究目标
本文提出一种针对结构化和偶发性缺失数据的新型插补方法,为整合多源EHR数据开展下游临床分析铺平道路。我们的目标是开发一种兼具鲁棒性和理论保障的方法,有效缓解集成分析中系统性和随机性数据缺失问题。通过解决这些复杂性,我们提升EHR数据的完整性与准确性,从而支持更...
材料与方法
本节详细阐述处理结构化和偶发性缺失的数据插补流程。首先介绍全文使用的基本符号与定义:对任意实数a和b,记a∧b和a∨b分别为两者最小值和最大值。矩阵的Frobenius范数记作‖·‖F,谱范数记作‖·‖(具体定义见补充材料A部分)。
结果部分:恢复精度
在3.3.1节的模拟设置1-2下,我们通过图2展示恢复过程的平均Frobenius范数与谱范数损失,并通过调整m1、m2、η和σ的取值来检验Macomss的理论性质与实证性能。
由图2可见,当m1、m2增大或σ、η减小(即矩阵A可观测行列增多、数据噪声降低、偶发性缺失减少)时,Macomss的数据恢复性能显著提升...
讨论
本文提出的Macomss矩阵补全方法能有效处理EHR集成分析中的关键缺失模式。该方法保留了因复杂医疗数据采集系统可能丢失的关键信息,确保下游临床与公共卫生分析保持鲁棒性,并更适用于大规模人群推广。结合理论...
结论
Macomss为多源EHR数据整合提供了一种操作简便、理论可靠的矩阵插补与去噪方法。本方法在插补过程中有效利用了复杂的缺失机制,解决了数据整合过程中随机性、结构性和异质性缺失的关键挑战。这些优势凸显了该方法在精准临床预测与人群健康研究中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号