基于倾向评分修正电子病历假记录以提升 2 型糖尿病患者急性冠脉综合征预测效能的研究

【字体: 时间:2025年05月29日 来源:Scientific Reports 3.8

编辑推荐:

  电子病历(EMR)假记录(假阳性、假阴性、缺失)影响急性冠脉综合征(ACS)预测模型性能。首尔国立大学研究团队针对接受基础胰岛素治疗的 2 型糖尿病(T2DM)患者,用倾向评分(PS)替代二元变量建模,发现 PS 数据集训练的 ML 模型性能及解释性更佳,为 ACS 风险预测提供新方法。

  
心血管疾病如同潜伏在人体中的 “隐形杀手”,急性冠脉综合征(ACS)作为其危急重症,尤其对代谢综合征患者如 2 型糖尿病(T2DM)人群威胁巨大。传统风险预测模型如 GRACE、TIMI 虽应用广泛,但存在人群覆盖狭窄、长期预测能力不足等局限,且电子病历(EMR)中二元变量的假记录(假阳性、假阴性、缺失)严重干扰机器学习(ML)模型的准确性。如何突破数据质量瓶颈、提升 ACS 预测的可靠性,成为临床与科研亟待解决的问题。

为攻克这一难题,首尔国立大学(韩国)的研究团队开展了一项创新性研究。他们聚焦接受基础胰岛素治疗的 T2DM 患者,提出以倾向评分(PS,定义为给定协变量下二元变量存在记录的概率)替代电子病历中的原始二元变量,旨在通过优化数据质量提升 ACS 预测模型的性能与解释性。研究成果发表于《Scientific Reports》,为糖尿病患者心血管风险管控提供了新方向。

研究主要采用以下关键技术方法:

  1. 数据来源与队列构建:数据取自首尔国立大学医院临床数据仓库(CDW),纳入 9338 例 T2DM 患者的 10184 个治疗周期,排除标准包括年龄 < 18 岁、1 型糖尿病、胰岛素治疗 < 1 个月及基线前有 ACS 史等。
  2. 倾向评分估计:运用 Logistic 回归(LR)、Light Gradient Boosting Model(LGBM)、XGBoost(XGB)、深度神经网络(DNN)、长短期记忆网络(LSTM)等算法,基于基线协变量(人口学、合并症、用药、检验结果等)估计各二元变量的 PS。
  3. 模型开发与验证:分别用原始数据集和 PS 数据集训练多种 ML 模型(LR、SVM、随机森林 RF、XGB、DNN、1D 卷积神经网络 CNN 等),以 10 折交叉验证优化参数,通过准确性、召回率、精确率、F1 分数、受试者工作特征曲线下面积(AUROC)评估性能,并与堆叠去噪自编码器(SDAE)模型对比。
  4. 解释性分析:采用 Shapley 加性解释(SHAP)方法识别关键临床预测因子,评估模型对已知 ACS 风险因素的覆盖度及关联方向的临床合理性。

研究结果


1. 患者基线特征与 ACS 发生率


研究对象平均年龄 60.2 岁,男性占 56.6%,最常见合并症为高血压(31.5%)和血脂异常(28.9%),6.9% 在胰岛素治疗期间发生 ACS。经合成少数过采样技术(SMOTE)平衡数据后,最终数据集包含 9474 例 ACS 样本。

2. PS 数据集显著提升模型预测性能


与原始数据集训练的模型相比,PS 数据集训练的模型整体表现更优。其中,XGB 模型性能最佳,AUROC 和 F1 分数较原始数据集模型分别提升 6.4% 和 7.8%。即使与先进的 SDAE 模型相比,PS 数据集训练的 DNN 模型 F1 分数仍高出 4.1%。敏感性分析显示结果稳健。

3. 关键风险因素识别与模型解释性优化


SHAP 分析表明,高龄、基线体重较高、基线血糖较高、抗血栓治疗史、胸痛史及 T2DM 进展指标(如老年性白内障)是 ACS 的重要风险因素。PS 数据集训练的模型更倾向于纳入指南明确的风险因素(如男性、高血压、血脂异常等),且关联方向与临床认知一致,解释性显著优于原始数据集模型。值得注意的是,模型还识别出磺酰脲类药物使用与 ACS 风险相关,这与既往研究结论吻合。

研究结论与讨论


本研究首次将倾向评分应用于电子病历二元变量的假记录修正,证实该方法可显著提升 T2DM 患者 ACS 预测模型的准确性与解释性。通过 PS 替代原始二元变量,有效降低了数据噪声的干扰,使模型更可靠地捕捉临床真实风险关联。相较于传统风险评分和复杂深度学习方法(如 SDAE),该策略兼具高效性与可解释性,为临床利用电子病历构建可信赖的预测工具提供了新范式。

尽管研究存在单中心数据、因果推断局限性等不足,但其提出的方法为解决电子病历数据质量问题开辟了新路径。未来若能在多中心数据中验证,有望推动精准化心血管风险预测工具的临床转化,助力早期识别高危患者、制定个性化干预方案,从而降低 ACS 发生率,改善糖尿病患者预后。该研究不仅为 ACS 预测领域提供了技术突破,也为其他慢性病的风险建模提供了方法论借鉴。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号