基于机器学习的预测模型的开发,用于预测新生儿细菌性脑膜炎的长期不良后果

《Jornal de Pediatria》:Development of a machine learning-based predictive model for long-term adverse outcomes in neonatal bacterial meningitis

【字体: 时间:2025年11月23日 来源:Jornal de Pediatria 2.5

编辑推荐:

  新生儿细菌性脑膜炎长期预后预测模型的构建与评估。纳入139名足月患儿,通过LASSO、Boruta和RFE多方法特征筛选,建立7种机器学习模型。随机森林(AUC 0.898)最优,平衡敏感度(0.887)与特异度(0.878),校准最佳(Brier 0.123)。关键预测因素为CSF WBC、蛋白及癫痫。模型为临床早期干预提供工具,但需多中心验证。

  新生儿细菌性脑膜炎(Neonatal Bacterial Meningitis, NBM)是一种对新生儿健康构成严重威胁的中枢神经系统感染疾病,其长期预后对患儿的生活质量和家庭负担有着深远影响。近年来,随着人工智能和机器学习技术的发展,越来越多的研究尝试将这些技术应用于临床医学领域,以提高疾病预测的准确性与效率。本文探讨了机器学习方法在NBM长期不良预后风险因素筛选中的应用,构建了多个模型并对其进行了全面评估,旨在为临床提供一种可靠的风险预测工具,以实现早期识别高风险患者和优化医疗资源分配。

### 研究背景与意义

新生儿细菌性脑膜炎通常由多种细菌引起,其发病率因地区和人群的不同而有所差异。在发达国家,该病的总体发病率已降至每千名活产婴儿0.3例,而在发展中国家则在0.8至6.1例之间波动。全球范围内,每年约有19万名新生儿因脑膜炎死亡,其中超过一半的幸存者会出现长期神经发育后遗症,如听力障碍、视力问题、脑瘫、癫痫、脑积水或认知功能障碍,其中四分之一的患者会经历严重的残疾。这些不良预后不仅影响患儿的健康,也给家庭和社会带来沉重的负担。

传统的预后评估方法通常依赖于单一数据类型,缺乏多模态数据的整合,难以实现早期和精准的不良预后识别。相比之下,机器学习(Machine Learning, ML)技术能够处理高维数据,结合多种临床信息,为复杂疾病的预测提供了新的思路。例如,Kausch等人利用心率和呼吸数据构建了新生儿败血症的预测模型,其曲线下面积(AUC)超过0.8;Cho等人则通过随机森林(Random Forest, RF)和逻辑回归(Logistic Regression, LR)方法识别了极低出生体重婴儿中坏死性小肠结肠炎(Necrotizing Enterocolitis, NEC)的风险因素,其模型准确率达到0.93。这些研究表明,机器学习在新生儿疾病预测方面具有显著潜力。

然而,目前针对NBM的AI研究仍较为有限,主要集中于诊断而非预后预测。本研究首次尝试利用机器学习技术,基于一组足月出生的NBM患儿构建预测模型,以评估长期不良预后,为临床提供个性化的干预策略和优化资源分配的依据。这不仅有助于提高NBM患者的预后评估水平,也为相关疾病的临床管理提供了新的方向。

### 研究方法与数据收集

本研究选取了2019年1月至2023年12月期间,在首都儿科研究所新生儿科住院并确诊为NBM的足月新生儿共139例。根据随访结果,这些患儿被分为不良预后组(n=45)和良好预后组(n=94)。研究过程中,研究人员收集了33项临床变量,包括一般信息(性别、剖宫产、出生体重、发病年龄、早期发病)、关键临床表现(异常体温、癫痫、喂养困难、意识改变、呕吐或吐沫、发绀、颅骨缝增宽、肝大、凝视、肌张力异常、原始反射异常、黄疸、脐炎)、实验室检查(C反应蛋白、外周血白细胞、中性粒细胞比例、血红蛋白、血小板计数、脑脊液白细胞计数、葡萄糖、蛋白、培养结果、血液培养结果)、听力筛查结果以及颅脑磁共振成像(MRI)结果(脑室炎、出血、脑积水、硬膜下积液、脓肿、脑软化等)。这些变量涵盖了NBM的多种临床特征,为构建全面的预测模型提供了丰富的数据基础。

在特征选择方面,研究人员采用了三种方法:LASSO回归、Boruta算法和递归特征消除(Recursive Feature Elimination, RFE)。其中,LASSO回归用于识别与不良预后显著相关的变量,Boruta算法通过随机森林进行特征重要性评估,RFE则基于随机森林的特征重要性排序来筛选变量。最终,研究人员保留了至少两种方法识别出的变量,以提高模型的稳定性并减少方法偏倚。经过特征选择,共有13个变量被纳入模型构建过程,这些变量涵盖了临床表现、实验室检查结果和影像学特征,具有较高的临床相关性。

在模型构建方面,研究人员开发了七种机器学习算法,包括逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)、极端梯度提升(XGBoost)、K近邻(KNN)、Light Gradient Boosting Machine(LightGBM)以及神经网络。所有模型均采用网格搜索结合10折交叉验证的方法进行超参数优化,以确保模型在训练集和测试集上的性能。模型的评估指标包括曲线下面积(AUC)、准确率、敏感度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、精确-召回曲线下的面积(PR AUC)以及布里尔分数(Brier score),这些指标共同反映了模型的预测能力和临床适用性。

### 研究结果与模型评估

研究结果显示,七种机器学习模型在预测NBM长期不良预后方面表现出不同的性能。其中,逻辑回归(LR)在判别能力方面表现最佳,其AUC值达到0.903(95%CI: 0.865–0.924),表明其在区分不良预后与良好预后方面具有较高的准确性。然而,LR的校准能力较差,布里尔分数为0.235,且特异度仅为0.828,这可能影响其在实际临床中的应用效果。相比之下,随机森林(RF)在整体性能方面表现最为均衡,其AUC值为0.898(95%CI: 0.848–0.942),准确率为0.881(95%CI: 0.821–0.929),敏感度为0.887,特异度为0.878,布里尔分数最低为0.123(95%CI: 0.103–0.148)。这些指标表明,RF在预测能力、分类性能和概率校准方面均优于其他模型,尤其是在临床应用中,其较高的准确率和良好的校准能力使其更适合作为预测工具。

决策曲线分析(Decision Curve Analysis, DCA)进一步验证了模型的临床实用性。在0.05至0.30的阈值范围内,RF、XGBoost和LightGBM模型在临床决策中的净收益高于“治疗所有”或“不治疗任何”策略,表明这些模型在实际应用中具有较高的临床价值。精确-召回曲线(Precision-Recall Curve, PR Curve)分析显示,RF在平均精确度方面表现最佳,达到0.777(95%CI: 0.675–0.870),其次是XGBoost(0.725),而SVM和KNN的性能相对较弱,分别为0.641和0.662。神经网络模型虽然在AUC方面表现中等,但在精确-召回平衡方面仍存在一定的不足。

此外,研究人员还使用了SHAP(Shapley Additive Explanations)方法对模型的可解释性进行了分析。结果表明,RF模型中最重要的三个特征是脑脊液白细胞计数、脑脊液蛋白水平和癫痫发作。这些特征在临床中具有明确的诊断意义,例如,脑脊液白细胞计数的升高通常与颅内感染的严重程度相关,而脑脊液蛋白水平的升高则与不良预后密切相关。癫痫发作作为一项重要的临床表现,其在RF模型中的权重较高,进一步表明其在预测长期不良预后中的重要性。同时,研究人员还发现,正常的脑脊液葡萄糖水平具有保护作用,能够降低不良预后的风险。

### 研究讨论与模型创新

本研究构建的机器学习模型在多个方面展现出创新性。首先,该研究首次利用足月出生的NBM患儿的长期随访数据,构建了一个适用于长期预后预测的机器学习模型。其次,研究人员通过结合LASSO、Boruta和RFE三种特征选择方法,提高了模型的稳定性并减少了方法偏倚。最终筛选出的13个核心预测变量,涵盖了NBM的多种临床特征,为模型的构建提供了坚实的理论基础。此外,模型的构建还考虑了新生儿特有的生理特征,如早期发病、前囟饱满和原始反射未完全引出,使得模型更加贴近临床实际,适用于大多数医院的临床条件。

在模型的可解释性方面,SHAP分析不仅提供了模型的整体解释,还对个体预测结果进行了可视化,增强了模型的透明度和临床可信度。这种可解释性对于临床医生来说尤为重要,因为它可以帮助他们更好地理解模型的预测依据,从而做出更加合理的临床决策。同时,模型的可解释性也有助于提高患者和家属对AI辅助诊断的接受度,推动其在临床中的广泛应用。

然而,本研究也存在一定的局限性。首先,研究样本量相对较小,且随访丢失率较高,这可能影响模型的泛化能力和实际应用效果。其次,研究采用的是单中心设计,限制了模型的外部适用性。因此,未来的研究应优先考虑建立多中心前瞻性队列,以提高模型的验证和适用范围。此外,研究中存在类别不平衡的问题,不良预后仅占总样本的32.4%,这可能导致模型对多数类别的过度拟合,降低其对少数类别(如不良预后)的识别能力。尽管研究人员采用了分层抽样和Youden指数优化阈值的方法,但未来研究可以进一步探索先进的技术,如合成少数类过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)或加权损失函数,以提高模型对不平衡数据的处理能力。

最后,尽管RF模型在整体预测性能方面表现最佳,其校准值(Calibration-in-the-large)为-0.026,表明其在风险预测上可能存在一定的系统性低估。这提示研究人员在临床应用中应更加关注模型的校准能力,而不仅仅是判别能力。未来的工作应强调校准作为模型评估的核心指标,并考虑采用后处理校准技术,以提高模型的概率准确性。

### 研究结论与未来展望

本研究基于机器学习技术,首次构建了一个适用于NBM长期不良预后预测的模型。通过整合多模态临床数据和采用综合的特征选择策略,研究人员识别出了13个核心预测变量,并选择了随机森林模型作为最终的预测工具。SHAP分析进一步验证了这些关键变量对模型预测结果的贡献,为临床提供了明确的预测依据。该模型为早期识别高风险婴儿和指导个体化干预提供了可靠工具,有助于改善NBM患者的预后。然而,为了进一步提高模型的准确性和适用性,未来的研究需要在多中心、大样本的队列中进行验证,并探索在床边临床实施中的应用前景。

本研究的成果为新生儿细菌性脑膜炎的长期预后预测提供了新的方法和思路,同时也为其他新生儿疾病的预测研究提供了借鉴。随着机器学习技术的不断进步,其在临床医学中的应用前景将更加广阔。未来的研究可以进一步探索不同类型的机器学习算法在新生儿疾病预测中的表现,并结合更多的临床数据和影像学信息,构建更加全面和准确的预测模型。此外,研究还可以关注模型的可解释性和临床实用性,以提高其在实际医疗环境中的应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号