《Seminars in Fetal and Neonatal Medicine》:Neonatal Artificial Intelligence and Machine Learning Mortality Prediction Modeling: A Systematic Review for Risk Adjustment in the Neonatal Intensive Care Unit
编辑推荐:
人工智能与机器学习模型在新生儿重症监护室死亡率预测中的应用存在单中心数据主导、外部验证不足及性能指标报告不规范等问题,需改进模型泛化能力与数据透明度以推动临床应用。
切尔西·K·比特勒(Chelsea K. Bitler)| 布里安娜·贝托尼(C. Briana Bertoni)| 布赖恩·C·金(Brian C. King)| 托马斯·A·胡文(Thomas A. Hooven)| 克里斯托弗·M·霍瓦特(Christopher M. Horvat)
新生儿-围产医学进修项目,匹兹堡UPMC儿童医院/马吉妇女医院新生儿医学科,美国宾夕法尼亚州匹兹堡市Halket街300号,邮编15213
摘要
- 死亡率仍是评估医疗质量的关键指标。在新生儿学领域,死亡率在不同科室及时间跨度内存在显著差异。然而,单纯比较粗死亡率不足以作为基准,因为这些数据未能考虑病例构成和疾病严重程度的差异。利用人工智能(AI)和机器学习(ML)进行风险调整已成为一种有前景的方法,有助于进行有意义的比较并推动医疗改进。本文旨在综述当前关于在新生儿重症监护病房(NICU)中使用基于AI/ML的模型预测死亡率的相关文献。
- 我们共识别出37项研究,涉及242个模型。大多数研究使用单中心数据开发模型,且缺乏外部验证;同时,性能指标的报告标准也不统一,这限制了评估的准确性。因此,在实现基于AI/ML的风险调整之前,还需进一步研究。
章节摘录
引言
- 尽管全球范围内新生儿住院情况的量化较为困难,但根据美国疾病控制与预防中心(CDC)国家卫生统计中心发布的最新报告,美国每年约有十分之一的新生儿需要入住新生儿重症监护病房(NICU)1。此外,过去十年间,所有孕周组和出生体重的新生儿住院率持续上升1。尽管许多NICU的总体死亡率较低,但各中心之间的死亡率仍存在显著差异。
方法
- 本系统评价遵循了《系统评价和荟萃分析优先报告项目》(PRISMA 2020)10和《TRIPOD系统评价和荟萃分析》(TRIPOD-SRMA)11指南进行。该评价未进行前瞻性注册,也未制定正式的研究方案,但作者预先定义了搜索、筛选和分析的策略。
结果
- 最终纳入的综述共包含37篇论文,涉及242个NICU死亡率预测模型。平均每篇论文描述了6到7个模型(见补充表II)。所有研究均阐述了模型的开发过程及初步验证情况;未发现任何评估已发表AI/ML模型通用性的研究。这些模型涵盖了过去35年间不同人群的新生儿数据(见图I)。
讨论
- 人工智能和机器学习的最新技术发展为重新评估新生儿学领域的质量评估策略提供了机会。这些基于AI/ML的新模型能够高效处理大量复杂数据,识别预测因子与结果之间的关联。此外,AI/ML方法还能识别非线性关系,并在未来的预测中利用以往的观察结果8。
结论
- 虽然人工智能和机器学习在新生儿医学的风险调整方面具有巨大潜力,但在临床应用之前仍存在一些关键问题亟待解决。例如,必须准确报告人口特征、训练方法和性能指标,以便更好地理解模型的实际应用效果。在选择模型之前,还需特别关注模型的通用性。