编辑推荐:
为解决儿童重症支原体肺炎(SMPP)诊断难题,研究人员构建相关模型,结果显示模型性能良好,意义重大。
在儿科疾病领域,儿童支原体肺炎(MPP)是一种常见的呼吸道疾病,由肺炎支原体(MP)感染引起。近年来,重症支原体肺炎(SMPP)的发病率逐渐上升,从 2006 年的 0.7% 增至 2016 年的 35% 。SMPP 的早期肺部表现特异性差,难以与其他病原体导致的肺损伤区分,而且目前缺乏统一明确的诊断标准。同时,随着大环内酯类药物在儿童中的广泛应用,耐药 MP 菌株日益常见,精准预测和识别 SMPP 对降低死亡率、减少并发症、改善预后至关重要。此外,SMPP 还可能引发心脏、肝脏等肺外并发症,却缺乏有效预测手段。因此,开展针对 SMPP 早期识别和器官损伤风险预测的研究迫在眉睫。
吉林大学第一医院和梅河口市中心医院的研究人员为解决上述问题,开展了一项多中心观察性回顾性研究。研究成果发表在《Scientific Reports》上,为 SMPP 的临床诊疗提供了有力支持。
研究人员采用了多种关键技术方法。首先,从两所医院收集病例构建样本队列,Cohort 1 用于构建区分 SMPP 与其他呼吸道疾病的鉴别诊断模型并进行内部验证;Cohort 2 用于预测 SMPP 肺外器官损伤类型,同样进行内部验证;Cohort 3 则来自另一所医院,用于对前两个队列构建的模型进行外部验证。其次,对收集的临床数据和实验室检测结果进行清洗、标准化和处理不平衡数据集等操作。然后,运用 5 种机器学习算法(极端梯度提升(XGBoost)、逻辑回归(LR)、轻量级梯度提升机(LightGBM)、K 近邻(KNN)和随机森林(RF))构建模型,通过 5 折交叉验证筛选出最佳算法和模型 。
研究结果如下:
- 队列基本特征:Cohort 1 中 SMPP 患者和其他呼吸道疾病患者在年龄、性别和部分实验室指标上存在显著差异;Cohort 2 中,心肌损伤、肝损伤和无损伤的 SMPP 患者在 CK-MB、ALT 等指标上差异显著;Cohort 3 中,SMPP 患者与其他呼吸道疾病患者以及 SMPP 各亚组之间在多个指标上均有显著差异。
- 诊断模型 1 的建立:通过 LASSO 回归筛选特征变量,5 种机器学习算法进行 5 折交叉验证,结果显示 LightGBM 算法表现最佳(AUCROC=0.975),其建立的模型 1 对 SMPP 和其他呼吸道疾病具有优秀的鉴别诊断能力(AUCROC=0.975,sensitivity =0.739,specificity =0.993) 。模型 1 中,PTA、PT 等 10 个特征重要性较高。
- 分类模型 2 的建立:在 Cohort 2 中,经相关性分析、特征变量选择后,基于 ALT、CK-MB 等指标,5 种机器学习算法对比,LightGBM 模型在区分 SMPP 患者三个亚组时表现出色(accuracy =0.814)。ALT 和 CK-MB 是影响模型输出的关键因素,ALT 与肝损伤相关,CK-MB 与心肌损伤相关。
- 外部验证:以 Cohort 3 为外部验证集,模型 1 的 AUCROC为 0.884(95% CI,0.860 - 0.909),敏感性为 0.769,特异性为 0.831 ,显示出稳定且优秀的 SMPP 鉴别诊断能力。模型 2 的整体诊断准确率为 74.9%,对不同类型器官损伤的诊断具有一定准确性。
研究结论和讨论部分指出,基于机器学习算法构建的模型在 SMPP 的鉴别诊断和器官损伤风险预测方面表现良好。与传统诊断模型相比,本研究的模型性能更优,例如 Chang 等人开发的预测儿童 SMPP 的列线图模型 AUC 仅为 0.777 。研究还发现年龄、LDH、CRP 等指标与 SMPP 密切相关,凝血指标在 SMPP 诊断中也具有重要意义。同时,研究也存在一定局限性,如研究队列同质性较高,无法展示多种机器学习模型的集成学习效果等。但总体而言,该研究为 SMPP 的临床诊断和治疗提供了重要参考,基于实验室参数的机器学习算法能够为 SMPP 的诊疗提供更清晰的决策指导,值得进一步开展临床研究和推广应用。