利用机器学习模型预测新冠疫情后急慢性肾病风险:美国国家电子健康记录的创新应用

【字体: 时间:2025年05月08日 来源:eBioMedicine

编辑推荐:

  新冠疫情后,急慢性肾病(CKD、AKI)风险预测存在空白。研究人员利用美国国家电子健康记录(EHR)和机器学习(ML)算法开展研究。结果显示最终模型预测性能良好,还开发了临床应用程序。这为肾病预测和临床诊疗提供了新途径。

  在全球新冠疫情的大背景下,健康领域面临着诸多新挑战。慢性肾病(CKD)在人群中广泛存在,在美国,2021 年约有 15% 的成年人,也就是 3700 万人患有 CKD ,但令人担忧的是,高达 90% 的患者可能并未察觉自身患病 。CKD 早期往往没有明显症状,很多患者直到病情发展到终末期肾病(ESRD)才被发现,此时往往需要透析或肾移植等治疗手段,给患者带来极大痛苦和经济负担。急性肾损伤(AKI)同样不容小觑,约 20% 的美国住院患者会受到影响 ,而且 AKI 若不能及时诊断,会增加住院死亡率、延长住院时间,还可能发展为 CKD 或 ESRD 。
此前的机器学习(ML)研究在预测肾病风险方面存在不少问题。比如,新冠疫情成为肾病重要风险因素后,多数 ML 算法因训练数据早于 2020 年,未能将其纳入考量;利用电子健康记录(EHR)的 ML 预测模型,缺乏像传统队列研究那样详细的队列构建和变量识别;计算机科学专家主导的研究,常重算法而轻临床意义和实际应用;样本量有限导致模型普适性不足;且研究成果很少转化为临床实用方案。

为解决这些问题,美国宾夕法尼亚州立大学医学院(Penn State College of Medicine)的研究人员开展了一项极具意义的研究。他们利用 TriNetX 研究网络的美国国家电子健康记录数据,模拟前瞻性队列研究,旨在预测新冠疫情后 AKI 和 CKD 的短期(1 个月)和长期(1 年)发病风险,评估将新冠感染史纳入预测指标的必要性,并开发临床实用的网页应用程序。

研究人员采用了一系列关键技术方法。首先,从 TriNetX 获取数据,构建包含 104,565 名患者的队列。通过设定筛选标准,排除不符合要求的患者,确保数据准确性。利用多种方法处理缺失数据和类别不平衡问题,如通过模拟数据集对比选择 XGBoost 默认设置进行缺失值填补,采用上采样(SMOTE 技术)和下采样平衡训练数据集。运用 8 种 ML 模型,包括自适应提升(AdaBoost)、极端梯度提升(XGBoost)等,结合 10 折交叉验证和自动网格搜索进行模型训练和调优。综合模型驱动、数据驱动和临床驱动的方法进行特征选择,确定最终模型。最后,基于 R Shiny 框架开发网页应用程序。

在研究结果方面:

  • 患者基本情况:研究共纳入 104,565 名患者,其中大部分患者(101,870 名)在随访期间未出现肾病,少部分患者分别在 1 个月或 1 年内发展为 AKI 或 CKD。CKD 患者的估算肾小球滤过率(eGFR)在 1 个月和 1 年预测窗口中均最低。
  • 变量重要性评估:通过评估,发现预测 AKI 时,前一年住院次数、eGFR 和血尿素氮(BUN)较为重要;预测 CKD 时,eGFR、肌酐清除率(CrCL)和住院次数较为关键。此外,BMI、血压、年龄、性别和新冠感染次数等因素也具有重要意义。
  • 模型性能评估:综合比较后,确定 9 个特征的模型表现最佳。XGBoost 在预测 1 个月 AKI(AUROC = 0.803)、1 年 AKI(AUROC = 0.799)和 1 年 CKD(AUROC = 0.894)时表现最优;随机森林(RF)在预测 1 个月 CKD(AUROC = 0.896)时表现最佳。
  • 网页应用开发:开发了名为 AIBI APP 的网页应用程序,用户输入 9 个选定变量值即可获取 AKI 和 CKD 的风险预测结果,且应用程序提醒使用者预测仅供辅助,不能替代专业诊断。

研究结论和讨论部分指出,该研究证实了利用大规模 EHR 数据和先进 ML 模型预测肾病风险的可行性。新冠感染次数纳入模型提升了预测性能,在未来肾病预测模型中应予以考虑。但研究也存在局限性,如 TriNetX 数据集的代表性问题、EHR 数据可能导致的偏倚、无法预测肾病不同阶段等。不过,该研究成果仍具有重要意义,为临床医生预测患者肾病风险提供了有力工具,有助于及时监测和干预,同时也为后续研究提供了方法学参考,推动了肾病预测领域的发展。这一研究成果发表在《eBioMedicine》上,为全球健康医学领域提供了宝贵经验。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号