《Scientific Reports》:Development and validation of a machine learning-based prediction model for thrombocytopenia following cardiopulmonary bypass
编辑推荐:
本研究针对体外循环(CPB)术后血小板减少症(TP)这一严重并发症,开发并验证了基于机器学习算法的预测模型。研究人员利用MIMIC-III数据库和医院内部数据,通过LASSO回归筛选出10个关键预测变量,构建了四种机器学习模型。结果显示XGBoost模型表现最优(内部验证AUC=0.841,外部验证AUC=0.795),其中ICU入院时血小板计数和乳酸水平是重要预测因子。该模型为早期识别高危患者提供了有效工具,对改善CPB术后患者预后具有重要意义。
当患者经历心脏手术中的体外循环(Cardiopulmonary Bypass, CPB)过程后,一种常见的严重并发症是血小板减少症(Thrombocytopenia, TP),即血液中血小板计数异常低下。这种情况在成年患者中的发生率约为26%至71%不等,且与死亡率增加、急性肾损伤(Acute Kidney Injury, AKI)发生风险提高、重症监护室(Intensive Care Unit, ICU)住院时间延长以及感染率上升等不良临床结局密切相关。因此,如何在术后早期准确识别出可能发生TP的高危患者,从而及时进行干预,成为临床实践中的一个重要挑战。
尽管近年来人工智能技术飞速发展,机器学习(Machine Learning, ML)算法在医疗领域,尤其是重症医学中的应用日益广泛,例如基于医疗信息市场重症监护(Medical Information Mart for Intensive Care, MIMIC)数据库的模型已能有效预测脓毒症患者的死亡风险,但专门针对CPB术后TP预测的研究仍相对有限,且往往缺乏外部验证,其临床适用性和泛化能力有待进一步证实。
为解决这一问题,由郭珊、程旭平、蒋宣东(通讯作者)和蔡旭峰共同完成的研究,在《Scientific Reports》上发表了题为"Development and validation of a machine learning-based prediction model for thrombocytopenia following cardiopulmonary bypass"的论文。该研究旨在利用机器学习算法,结合最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归进行变量筛选,开发并验证一个能够预测CPB术后TP发生风险的模型。
为了开展这项研究,研究人员主要采用了回顾性队列研究设计。数据来源包括大型公共数据库MIMIC-III以及我国东阳市人民医院的本地数据。纳入标准为首次接受CPB并入住ICU的成年患者。研究排除了ICU住院时间不足24小时、CPB前已存在TP、患有血液系统恶性肿瘤、原发性血小板减少症、肝素诱导性血小板减少症以及数据缺失超过20%的患者。TP定义为ICU期间任一时点血小板计数低于100 x 109/L。在数据处理方面,研究首先从入院24小时内收集的83个候选预测变量中,通过处理缺失值和高相关性变量,筛选出57个变量。随后采用LASSO回归结合10折交叉验证最终确定了10个与TP最相关的关键变量用于模型构建。研究团队使用了四种机器学习算法来建立预测模型,包括支持向量机(Support Vector Machine, SVM)、C5.0决策树、朴素贝叶斯(Naive Bayes)分类器和极限梯度提升(eXtreme Gradient Boosting, XGBoost)。模型性能通过受试者工作特征曲线下面积(Area Under the Curve, AUC)、准确度、精确度、召回率、特异度和平衡准确度等指标进行评估,并进行了内部验证和外部验证。此外,研究还采用了局部可解释模型无关解释(Local Interpretable Model-agnostic Explanations, LIME)和iBreakdown等可解释性人工智能(Explainable AI)方法来解释模型的预测结果,增强其临床可理解性。
患者基线特征与临床结局比较
研究最终纳入了5,348名患者(MIMIC-III数据库),其中训练集3,744人,内部验证集1,604人。东阳市人民医院的486名患者作为外部验证集。分析显示,在MIMIC-III数据中,TP发生率为26.01%。与未发生TP的患者相比,TP患者年龄更大,体重更轻,有高血压和糖尿病病史的比例较低,使用血管活性药物和发生急性肾功能衰竭的比例更高(P < 0.001)。在生化指标方面,TP组的初始血小板计数、乳酸水平、国际标准化比率(International Normalized Ratio, INR)以及接受肾脏替代治疗(Renal Replacement Therapy, RRT)的比例均存在显著差异(P < 0.001)。在疾病严重程度方面,TP组的序贯器官衰竭评估(Sequential Organ Failure Assessment, SOFA)评分显著高于非TP组(P < 0.001)。更重要的是,TP组的ICU住院时间、总住院时间以及死亡率均显著差于非TP组(P < 0.001)。外部验证数据集中TP的发生率为40%,其基本特征与结局的比较趋势与训练集相似。
模型构建与评估
通过LASSO回归筛选出的10个关键预测变量包括:血小板计数(Platelet count)、年龄(Age)、乳酸水平(Lactic)、白细胞计数(White blood cell count, WBC)、SOFA评分、最低血糖(Glucose_min)、最高血糖(Glucose_max)、INR、钙水平(Calcium)和是否接受RRT。研究构建的四种机器学习模型在内部验证集上均表现出良好的预测能力,AUC值在0.804至0.841之间。其中,XGBoost模型表现最佳,AUC为0.841。在外部验证中,所有模型仍保持稳健的预测性能,XGBoost模型的AUC为0.795(95%置信区间:0.755-0.835),其他模型的AUC也在0.790至0.799之间。详细性能指标显示,在内部验证中,XGBoost模型的准确度为0.830,召回率为0.840,平衡准确度为0.809,精确度高达0.951。在外部验证中,其准确度(0.761)和召回率(0.838)依然高于其他模型,尽管精确度(0.746)和特异度(0.674)较内部验证有所下降,但综合性能依然最优。因此,XGBoost模型被选为最终的最佳预测模型。
模型解释
对XGBoost模型的进一步分析揭示了各变量的重要性。全局特征重要性排名显示,ICU入院时的血小板计数、乳酸水平、最低血糖、白细胞计数和SOFA评分是对模型预测影响最大的五个因素。通过LIME对个体患者预测的解释示例如下:对于一名初始血小板计数为111 x 109/L的患者(患者2),模型预测其"不发生TP"(概率0.76),但特征"血小板≤126"(红色,表示"矛盾")提示低血小板本应支持"发生TP"的预测,这表明模型可能综合了其他保护性因素(如相对较好的血糖控制"85<葡萄糖_min≤96")做出了最终判断。而对于另一名初始血小板计数为155 x>葡萄糖_min≤96")做出了最终判断。而对于另一名初始血小板计数为155>9/L的患者(患者3),特征"血小板>126"(蓝色,表示"支持")与其最终被预测为"发生TP"(概率0.38)一致,说明该患者可能并存其他高危因素(如较高的SOFA评分或乳酸水平)导致了高风险预测。iBreakdown算法的分析也直观地展示了各个变量对特定患者预测概率的具体贡献值。
本研究成功开发并验证了一个基于XGBoost机器学习算法的模型,用于预测CPB术后患者发生TP的风险。该模型在内部和外部验证中均表现出良好的区分度和临床适用性。研究发现,CPB术后TP相当常见,且与更差的临床结局相关,这与既往研究结论一致。模型识别出的关键预测因子,如入院血小板计数、乳酸水平、SOFA评分等,均是ICU中易于获取的临床参数,具有重要的临床参考价值。特别是血小板计数和乳酸水平被确定为最关键的影响因素,这为后续机制研究和针对性干预提供了方向。
研究的优势在于使用了大规模数据库、严格的变量筛选、多种机器学习算法的比较以及重要的外部验证,同时结合了模型可解释性方法,增强了结果的可信度和临床可接受度。然而,研究也存在一些局限性,例如其回顾性设计可能引入偏倚,数据中缺少体外循环时间、手术时长、术中失血量等关键信息,以及训练集(MIMIC-III,主要反映美国人群)与外部验证集(中国东阳人群)在基线特征(如平均初始血小板计数、合并症比例)和医疗实践上存在差异,这提示直接将模型应用于不同中心时可能需要进行本地化校准或采用迁移学习技术。
总之,这项研究构建的XGBoost预测模型为CPB术后TP的早期风险识别提供了有力的工具,有望辅助临床医生对高危患者实施早期预警和个性化管理,从而可能改善患者预后。未来需要在更大规模、更多样化的队列中进行前瞻性验证,并探索将其整合到临床决策支持系统中的可行性,以最终证实其改善患者结局的价值。