基于机器学习模型预测川崎病静脉注射免疫球蛋白抵抗:关键突破与临床价值

【字体: 时间:2025年02月28日 来源:iScience 4.6

编辑推荐:

  为准确预测川崎病(KD)静脉注射免疫球蛋白(IVIG)抵抗,研究人员构建模型,发现关键预测指标,助力临床决策。

  川崎病(Kawasaki disease,KD)是一种好发于幼儿的急性全身性血管炎,主要影响中等大小动脉,尤其是冠状动脉。在发达国家,它已成为儿童后天性心脏病的主要病因之一。大剂量静脉注射免疫球蛋白(intravenous immunoglobulin,IVIG)治疗虽能有效降低冠状动脉病变(Coronary artery lesions,CALs)的发生率,但仍有 10%-20% 的患者对 IVIG 治疗存在抵抗。而 IVIG 抵抗与 CALs 的发生密切相关,因此,准确识别 KD 患者中 IVIG 抵抗的高风险人群,对实施早期治疗策略、预防 CALs 的发展至关重要。
此前,虽然已有研究基于不同人群开发了 IVIG 抵抗的评分系统,但这些传统模型存在局限性。例如,基于日本人群开发的评分系统在其他人群中的适用性有限,而基于逻辑回归算法构建的模型,在处理输入特征与结果之间的非线性关系以及特征间的相互作用时,表现不佳。因此,开发更精准、普适性更强的预测模型迫在眉睫。

为解决这些问题,温州医科大学附属第二医院、育英儿童医院等多家机构的研究人员展开了深入研究。他们旨在开发一种基于机器学习的 KD 患者 IVIG 抵抗预测模型,并确定关键预测指标。相关研究成果发表在《iScience》杂志上。

研究人员在此次研究中,采用了多种关键技术方法。首先,他们利用温州医科大学附属育英儿童医院的 KD 数据库,收集了 2008 年 1 月至 2022 年 10 月期间符合条件的患者数据。之后,运用时间序列分割法,将数据集按 7:3 的比例分为训练集和测试集 。同时,采用支持向量机合成少数过采样技术(SVM-SMOTE)处理数据不平衡问题。研究人员使用了六种机器学习算法构建模型,并通过 5 折交叉验证优化超参数。利用 Shapley 加性解释(SHAP)方法对特征的重要性进行量化和排序,还用学习曲线评估样本量的充足性。

下面来看具体的研究结果:

  1. 患者的人口统计学和临床特征:研究人员从温州医院数据库中筛选出 1949 名儿童纳入机器学习集,其中 244 例(12.4%)为 IVIG 抵抗患者。数据集按时间序列分为训练集(1377 例患者,11.6% 为 IVIG 抵抗)和测试集(592 例患者,14.2% 为 IVIG 抵抗) 。此外,还纳入了绍兴医院和衢州医院的患者作为外部验证集。通过比较发现,温州医院患者的 IVIG 抵抗率数值上较高,且 IVIG 抵抗患者的炎症指标升高,与炎症负相关的指标水平较低,反映出更严重的炎症状态。
  2. 模型构建与评估:研究人员构建并验证了六种机器学习模型,其中随机森林模型表现最佳。在 5 折交叉验证中,其平均受试者工作特征曲线下面积(AUC)为 0.711;在测试集验证中,AUC 达到 0.751;在绍兴和衢州的外部验证集中,AUC 分别为 0.827 和 0.735 。尽管在外部验证中,轻量级梯度提升机(LGBM)模型的 AUC 在部分数据集上高于随机森林模型,但随机森林模型在内部和外部评估中表现更稳健、一致,因此被选用于后续分析。
  3. SHAP 特征分析:SHAP 分析显示,在测试集和外部验证集中,C 反应蛋白与白蛋白比值(CAR)、预后营养指数(PNI)和性别是预测 IVIG 抵抗的最重要特征。进一步的分层分析表明,无论男女,CAR 和 PNI 始终是影响 IVIG 抵抗的两个最重要预测指标。
  4. 样本量评估:通过学习曲线分析评估随机森林模型的样本量,结果表明当训练集达到 600 个样本时,AUC 随样本量增加显著上升,之后 AUC 波动较小,说明此时模型性能已有效稳定,样本量足够。
  5. 与先前预测模型的比较:研究人员将构建的随机森林模型与传统评分系统进行比较,结果显示随机森林模型(AUC=0.751 )的预测能力显著优于以往的模型,如 Egami 模型(AUC =0.650)、Kobayashi 模型(AUC =0.646)等。

在研究结论与讨论部分,研究人员成功开发了一种基于机器学习的模型,用于预测 KD 患者的 IVIG 抵抗,且该模型表现出强大的预测能力。CAR、PNI 和性别被确定为 IVIG 抵抗的关键预测指标。该模型克服了传统评分系统的局限性,能有效处理特征间的复杂关系,提高预测准确性。尽管外部验证集规模较小,且需要前瞻性研究进一步验证模型性能,但该模型有望整合到电子健康记录系统中,为临床决策提供支持。若能纳入更多数据,如基因变异信息,将进一步提升模型的预测能力,为川崎病的临床治疗带来新的突破,帮助医生更精准地识别高风险患者,制定个性化治疗方案,降低冠状动脉病变的发生率,改善患者预后。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号