使用具有强大外部验证能力和临床应用评估能力的可解释机器学习模型,实现川崎病的早期识别

《European Journal of Medical Research》:Early identification of Kawasaki disease using an interpretable machine learning model with robust external validation and clinical utility assessment

【字体: 时间:2026年06月10日 来源:European Journal of Medical Research 3.4

编辑推荐:

   摘要 背景 川崎病(KD)是儿童获得性心脏疾病的主要原因,诊断延迟会显著增加冠状动脉瘤的风险。由于没有单一的实验室检测方法能够确诊川崎病,将其与其他儿童发热性疾病区分开来在临床上仍然具有挑战性。现有的用于识别川崎病的机器学习(ML)模型缺乏独立的外部验

  

摘要

背景

川崎病(KD)是儿童获得性心脏疾病的主要原因,诊断延迟会显著增加冠状动脉瘤的风险。由于没有单一的实验室检测方法能够确诊川崎病,将其与其他儿童发热性疾病区分开来在临床上仍然具有挑战性。现有的用于识别川崎病的机器学习(ML)模型缺乏独立的外部验证和一致的校准报告。我们的目标是基于常规实验室参数开发并对外部验证一个可解释的ML模型,以实现早期诊断。

方法

我们进行了一项回顾性的双中心TRIPOD+AI诊断准确性研究(武汉儿童医院,内部样本量n=5,261;湖北省人民医院,外部样本量n=461)。在36个候选常规变量上对9种ML算法进行了基准测试;LASSO算法筛选出了27个非零预测因子。这些模型经过了10×10次的重复交叉验证;选择标准包括外部测试性能(最大AUC值;最小Brier分数;敏感性≥85%)。外部队列数据被设为盲态,以评估模型的可迁移性。校准工作按照Van Calster层次结构进行评估;临床效用通过决策曲线分析来衡量;可解释性则通过SHAP方法进行评估。

结果

XGBoost模型获得了最高的外部测试AUC值(0.962,95%置信区间0.961–0.964)、最高的内部测试AUC值(0.970)以及最低的内部测试Brier分数(0.065)。盲法外部验证的AUC值为0.893(95%置信区间0.863–0.920)。在阈值0.699时,内部敏感性为85.7%(特异性为96.1%),外部敏感性为65.8%(特异性为95.0%)。通过三区贝叶斯框架将操作敏感性提升至72.8%;通过站点特定的Platt重新校准方法,敏感性进一步恢复到84.8%,但特异性有所下降(从95.2%降至75.4%)。似然比为PLR=13.16,NLR=0.360。SHAP分析显示,前白蛋白、GGT、CK、中性粒细胞、hsCRP和白细胞是六个最重要的特征(占总贡献的39.6%),且这些特征在不同队列间的稳定性较高(Spearman ρ=0.949)。

结论

仅基于外部测试性能进行校准的XGBoost模型在九种算法中表现最佳,盲法外部验证证明了其可迁移性,并且通过站点特定的重新校准可以纠正校准偏差。SHAP分析表明,前白蛋白和γ-谷氨酰转移酶是当前AHA诊断标准中未包含的具有诊断价值的生物标志物。该模型可免费访问:https://lismith0802.shinyapps.io/kawasaki-predictor-v17-xgb/

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号