
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的急诊颅脑创伤患者凝血功能障碍早期预测模型构建与验证研究
【字体: 大 中 小 】 时间:2025年09月19日 来源:Frontiers in Neurology 2.8
编辑推荐:
本研究利用机器学习(ML)技术,开发了一种基于常规临床和实验室指标的随机森林(RF)模型,可快速预测急诊颅脑创伤(TBI)患者凝血功能障碍风险。该模型表现出卓越的判别能力(AUC=0.92)和临床实用性,其关键预测因子包括中性粒细胞百分比、白球比(A/G ratio)和丙氨酸氨基转移酶(ALT),揭示了炎症反应和肝功能失调在TBI相关凝血病中的核心作用。该工具为急诊室实现精准风险分层和早期干预提供了新策略。
引言
创伤性脑损伤(TBI)是急诊科最常见危重症之一,全球每年约发生5000万例,显著增加死亡和残疾风险,构成重大公共卫生挑战。研究表明,约35%的TBI患者入院时即出现凝血功能障碍,这可导致继发性脑损伤(如血肿扩大和新发出血),显著恶化患者预后。因此,及时识别和管理凝血功能障碍不仅是急诊TBI治疗的核心环节,而且直接关系到患者的预后。
目前,凝血功能评估依赖于传统检测方法,如凝血酶原时间(PT)和活化部分凝血活酶时间(APTT)。然而,这些方法耗时较长(通常需要数十分钟至数小时),且对创伤诱导的凝血病敏感性有限。近年研究发现,TBI相关凝血病与炎症反应、血管内皮损伤和肝脏凝血因子合成受损等多种因素密切相关。这些复杂机制亟需快速、全面的预测工具以满足急诊救治的时间敏感性需求。
机器学习(ML)能够整合高维数据,发现传统统计方法难以捕捉的预测模式,在创伤医学中展现出优于传统模型的潜力。尽管ML在急诊风险分层中的应用近期显著提高了预测准确性,但针对TBI相关凝血病快速预测的研究仍很有限,现有模型往往缺乏可解释性或实时应用性。本研究旨在利用急诊科可获取的常规临床和实验室数据,开发并验证一种基于机器学习的预测模型,以快速识别TBI患者中凝血病的高危人群,支持早期干预,促进精准急诊管理。
方法
数据来源
本研究利用重庆市第九人民医院的TBI数据库,收集了2018年1月至2024年12月急诊科TBI患者的临床和实验室数据。预测目标是患者是否会发展为凝血功能障碍(二分类变量)。凝血功能障碍的定义为国际标准化比值(INR)升高(INR≥1.2)或活化部分凝血活酶时间(APTT)延长(参考范围28–34秒)。收集的临床特征包括人口统计学信息(如年龄、性别)、合并症(如高血压、糖尿病)、创伤相关指标(如GCS评分、TBI类型、损伤部位)和实验室结果(如全血细胞计数、肝肾功能测试、电解质)。纳入标准为:年龄≥18岁、CT确诊的TBI、以及入院2小时内具有完整的实验室数据。排除标准包括:严重非颅脑多发伤、既往存在的凝血功能障碍(如血友病)、使用抗凝药物(以避免混淆因素)或缺失关键数据。本研究经重庆市第九人民医院伦理委员会批准(伦理批准号:2025011)。由于本研究为回顾性设计,伦理委员会豁免了知情同意和临床试验注册的要求。所有数据均以匿名方式收集和分析,不会对患者造成潜在伤害。研究遵循《赫尔辛基宣言》(2013年修订版)进行。
数据预处理
数据预处理在R 4.3.3环境中完成。数据集按7:3比例(分层抽样以确保凝血病比例平衡)划分为训练集和测试集。使用R包“dplyr”(V1.1.4)处理缺失值,数值变量使用中位数填补,分类变量使用众数填补。分类变量通过独热编码转换为数值形式。使用“mlr3pipelines”(V0.7.2)对数值特征进行中心化(均值=0)和标准化(标准差=1)。为处理数据不平衡问题,使用R包“smotefamily”(V1.4.0)应用“SMOTE”技术(K=5,复制因子=5)生成合成样本,并基于信息增益选择前70%最具预测性的特征,移除零方差特征。最终数据集通过R包“mlr3”(V0.23.0)框架定义为二分类任务(ID“Coagulation”),并使用5折交叉验证划分训练和验证数据。
模型选择与快速筛选
为选择合适的机器学习算法,使用mlr3框架初步评估了11种模型的默认参数性能,包括随机森林(RF)、梯度提升机(GBM)、XGBoost、弹性网正则化逻辑回归、朴素贝叶斯、决策树、逻辑回归、k最近邻(k-NN)、支持向量机(SVM)、线性判别分析(LDA)和单层神经网络。评估过程采用5折交叉验证,以曲线下面积(AUC)为主要指标,辅以准确率、精确率、召回率和F1分数。选择性能最佳的随机森林、梯度提升机和支撑向量机进行超参数调优。
超参数调优
随机森林的优化参数包括树的数量(100–500)、分裂特征数(2–12)、最小节点大小(1–8)和最大节点数(3–10),使用R包“mlr3tuning”(V1.3.0)通过随机搜索(50次迭代)进行。梯度提升机优化树的数量(50–1,000)、交互深度(3–10)和学习率(0.01–0.1),使用Hyperband算法。支持向量机优化核类型(线性/多项式/径向)、正则化参数(0.1–10)、核参数(0.01–1)和多项式核度数(2–5),使用随机搜索。调优目标为AUC,结合5折交叉验证,全面评估AUC、准确率、精确率、召回率和F1分数。选择性能最佳的模型进行进一步分析。
最终模型训练与评估
随机森林表现最佳,被选为最终模型,使用最优超参数(树的数量=225,分裂特征数=8,最小节点大小=2,最大节点数=5)在整个数据集上重新训练,配置概率输出以支持后续分析,通过mlr3框架实现。模型性能通过5折交叉验证评估,报告AUC、准确率、精确率、召回率和F1分数的平均值和中位数,以及混淆矩阵的分类错误分布分析。使用随机森林的袋外误差(OOB error)验证决策树数量的充分性。模型输出凝血功能障碍概率,基于ROC曲线优化,选择概率阈值0.6(对应SHAP值>0.7)以平衡敏感性和特异性。
模型解释
为增强模型可解释性,采用全局和局部分析方法。在全局层面,使用DALEX包通过Dropout Loss计算特征对预测的贡献,结果通过R包“ggplot2”(V3.5.1)以条形图可视化。在局部层面,使用R包“shapviz”(V0.9.7)计算150个随机样本的SHAP值,分析特征对个体预测的贡献,通过蜂群图和力图可视化,背景数据集从100个预处理数据点中随机抽样。
统计分析
统计描述和分析在R 4.3.3环境中完成。连续变量以均值±标准差描述,分类变量以频数(百分比)描述,组间比较使用Wilcoxon秩和检验或卡方检验,显著性水平设定为p<0.05。
结果
队列的临床特征
2018年至2024年间,急诊科共收治658例急性TBI患者,其中405例符合初步纳入标准。排除缺失关键数据或其他不符合条件的患者(n=83)后,最终纳入322例患者(平均年龄55.7±21.1岁,61%为男性)进行分析。51例患者(15.8%)被诊断为凝血功能障碍。基线特征总结显示,凝血功能障碍组与非凝血功能障碍组之间存在显著临床差异:(1)创伤严重程度:凝血功能障碍组的GCS评分显著低于非凝血功能障碍组(7.7±2.7 vs. 9.4±2.5, p<0.001)。(2)炎症反应:凝血功能障碍组的中性粒细胞百分比显著升高(85.0%±11.0% vs. 70.0%±11.0%, p<0.001)。(3)肝功能指标:凝血功能障碍组的ALT水平较高(28.1±7.1 vs. 22.3±5.1 U/L, p<0.001),A/G比较低(1.31±0.32 vs. 1.72±0.24, p<0.001)。(4)血液学指标:凝血功能障碍组的血红蛋白(Hb)水平较低(104.3±11.7 vs. 117.8±9.8 g/L, p<0.001),白细胞计数(WBC)和中性粒细胞计数(NEUT)显著升高(p<0.001)。其他参数如血清钠、钾、钙和性别无显著差异(p<0.05)。
模型选择与初步性能筛选
使用mlr3框架初步评估了11种机器学习算法的默认参数性能。尽管在急诊环境下召回率可能是模型性能的主要考量,但所有模型均保持了较高的召回率水平(0.93–0.97),因此基于AUC的优化策略更符合临床风险分层需求。结果显示,GBM算法(AUC=0.89)、RF算法(AUC=0.88)和SVM算法(AUC=0.87)表现最佳,被选为后续超参数调优的候选模型。
最优模型建立与评估
经过超参数调优后,获得了这三种算法的性能参数。RF算法表现最佳,测试集AUC从0.87提升至0.92(ΔAUC=+0.04),交叉验证AUC中位数为0.91(IQR 0.89–0.93)。相比之下,GBM和SVM算法的AUC分别提升至0.90和0.88,而RF算法的训练时间仅为GBM的15%(2.3分钟 vs. 15分钟),使其更适用于急诊环境的实时预测需求。此外,AUC和PRC曲线显示RF模型优于GBM和SVM。分类错误分析表明,RF的阴性预测错误率低至6%,优于GBM(9%)和SVM(17%)。因此,随机森林算法被认为是最优模型。RF的最优参数为:决策树数量=225,分裂特征数=8,最小节点大小=2。模型稳健性分析显示,当树数量>220时,OOB误差进入稳定平台期(<0.08),表明225棵树充分平衡了模型复杂度和预测准确性。错误率在凝血功能障碍组为0.13(95%CI 0.10–0.16),在非凝血功能障碍组为0.05(95%CI 0.03–0.07),McNemar检验显示组间错误无显著差异(p=0.12)。
随机森林模型特征重要性分析显示,中性粒细胞百分比、A/G比、ALT、血红蛋白(Hb)、中性粒细胞计数、白细胞计数、GCS评分和淋巴细胞百分比是关键预测因子。SHAP分析进一步揭示:(1)正向驱动因素:中性粒细胞百分比>90%贡献了最高的SHAP值,表明强烈的炎症反应是凝血病的核心诱导因素;A/G<1.15和ALT>33.4 U/L提示肝功能失调,与凝血因子减少相关。Hb<109.5 g/L和白细胞计数>20.2×109/L与凝血病风险增加相关,反映了创伤相关失血和炎症反应的贡献。(2)保护性因素:GCS评分>8(非线性关系)和淋巴细胞百分比>15%(抗炎状态)与凝血病风险降低相关。
讨论
模型性能与临床意义
RF模型的卓越性能得益于其处理高维、异构数据的强大能力。研究发现,模型的阴性预测错误率低至6%,这在急诊环境中尤为重要,因为漏诊凝血病可能导致血肿扩大等严重后果。与现有文献相比,本研究的AUC(0.92)高于之前基于逻辑回归的TBI凝血病预测模型(AUC=0.80–0.85),展示了集成学习方法的优势。此外,RF模型的训练时间仅为梯度提升机的15%,这对于需要快速部署的急诊预测系统至关重要。模型的稳健性通过袋外误差(OOB error<0.11)和McNemar检验(p=0.12)得到验证,表明在不同数据子集上表现一致,适用于动态急诊环境。此外,传统凝血测试(CCA)面临诊断标准不一致和TBI患者阳性率多变的问题,而本研究模型的AUC达到0.92,显著优于CCA的单一指标(如INR或APTT),并整合了炎症和肝功能等动态指标,更符合TBI凝血病的多因素病理机制。早期识别凝血病对降低再出血风险的重要性已得到广泛认可;该模型的快速预测能力(训练时间仅2.3分钟)可支持急诊科在黄金时间内启动针对性治疗(如氨甲环酸或PCC输注),符合指南推荐的“损伤控制”策略。
值得注意的是,本研究优先优化AUC而非召回率,尽管后者在急诊环境中通常更为关键。这一方法是合理的,因为所有候选模型均保持了高召回率水平(0.93–0.96),使得AUC优化更适用于实现风险分层,从而帮助临床医生精准识别高危患者并合理分配医疗资源。未来研究可进一步探索不同召回阈值下的模型性能,以满足特定临床需求(如最大化敏感性以降低漏诊率)。
此外,本研究报告的凝血病发生率(15.8%)低于引言中提到的35%,可能原因包括排除了抗凝药物使用者以及采用了更严格的凝血病定义(INR≥1.2或APTT>34秒)。而且,凝血病风险随创伤严重程度显著增加,本研究中重度TBI比例相对较低(约20%患者GCS≤8)可能进一步解释了总体发生率较低的原因。
关键预测因子及其机制
特征重要性分析表明,中性粒细胞百分比、A/G比、ALT、血红蛋白(Hb)、中性粒细胞计数、白细胞计数、GCS评分和淋巴细胞百分比是预测TBI相关凝血病的核心因素。中性粒细胞百分比是主要预测因子,证实了TBI触发的炎症级联反应是凝血病的核心驱动因素。TBI后的炎症反应通过组织因子(TF)和内源性抗凝途径(如蛋白C途径)的激活导致凝血因子消耗,这与本研究中中性粒细胞百分比的高贡献一致。此外,中性粒细胞释放的中性粒细胞胞外陷阱(NETs)可能加剧纤溶亢进,值得进一步研究。低A/G比和高ALT提示肝功能失调,这可能直接关系到TBI后合成凝血因子能力的下降。这可能与肝脏合成抗凝因子(如抗凝血酶III)的作用相关,与Tsai等人发现的De Ritis比(AST/ALT)与创伤严重程度相关的结果一致,表明肝功能指标可能作为TBI患者凝血病风险的生物标志物。低Hb水平作为一个显著预测因子,可能反映了创伤相关的隐匿性出血或炎症诱导的红细胞生成抑制。Prisco等人也发现低Hb是重度TBI患者死亡率的重要预测因子,突出了创伤严重程度与凝血病之间的紧密联系。此外,凝血功能障碍组患者年龄较大、Hb水平较低、GCS评分较差。这些发现与Depreitere等人关于老年创伤患者脆弱性的研究一致,表明老年TBI患者生理储备减少可能导致更严重的临床 outcomes。然而,本研究中年长患者的凝血病发生率并未显著增加,可能原因是重度TBI病例比例较低(约20% GCS≤8)以及凝血病的严格定义(INR≥1.2或APTT>34秒)。此外,GCS评分>8和高淋巴细胞百分比作为保护因素,与较轻创伤和抗炎状态相关,可能通过减轻全身炎症负荷来降低凝血病风险。GCS≤8的重度TBI患者凝血病发生率高达60%,与本研究发现一致(当GCS≤8时风险急剧增加)。白细胞计数的升高进一步支持了炎症在凝血病发生中的关键作用。这些指标在常规急诊评估中易于获取,增强了模型的临床适用性。本研究识别的预测因子与现有文献一致,为TBI相关凝血病的病理生理机制提供了新见解。
临床应用场景
该模型可集成到急诊决策支持系统中,支持以下场景:(1)高危患者分层:SHAP值>0.7对应模型预测概率>0.6;基于交叉验证召回率>0.93和假阴性率<6%,适用于识别高危患者并优先进行血栓弹力图检测,以指导个体化输血(如纤维蛋白原浓缩物)。(2)动态监测:入院后24小时内每6小时输入更新的实验室数据,以动态更新预测概率并捕捉延迟性凝血病。(3)资源优化:优先将重症监护资源分配给高危患者,并优化急诊流程。结合“损伤控制”策略(如氨甲环酸),可进一步增强效果。
优势与局限性
本研究的主要优势包括:(1)利用真实世界数据,增强了模型的泛化能力;(2)应用SMOTE技术处理数据不平衡,确保了对少数类(凝血功能障碍组)的预测能力;(3)通过SHAP和DALEX分析提供全局和局部解释,增强了模型的可解释性,帮助临床医生理解预测结果。然而,研究也存在局限性,包括:(1)数据来源于单一机构,样本量有限(n=322),且出血障碍组(n=51)与非出血障碍组(n=271)之间存在显著不平衡,反映了TBI相关出血障碍的实际发生率(15.8%)。尽管我们使用SMOTE解决了数据不平衡问题以增强对少数类(出血障碍组)的预测能力,但这种不平衡可能仍影响模型的泛化能力,尤其是在不同人群或医疗环境中。因此,未来的多中心研究应纳入更大样本量和更平衡的组别,以进一步验证模型的稳健性和适用性。(2)由于数据缺失,排除了抗血小板药物,可能低估了部分患者的出血风险。(3)模型的实时部署仍需验证,未来需要开发用户友好界面并进行前瞻性测试,以评估其在真实急诊环境中的性能。
未来方向
本研究的RF模型为快速预测TBI凝血病提供了有效工具,但仍有改进空间。首先,多中心研究可验证模型的泛化能力,并纳入更广泛的患者群体(如不同种族、年龄组或有合并症的患者)。其次,探索深度学习方法(如卷积神经网络)或时间序列分析,以捕捉TBI后凝血状态的动态变化。此外,结合床旁凝血检测技术(如血栓弹力图)可能进一步提升模型的实时能力和准确性。最后,基于该模型开发临床决策支持系统(CDSS),并通过随机对照试验评估其对患者 outcomes 的实际影响,是未来研究的重要方向。
结论
本研究证明,基于随机森林的机器学习模型能够高效预测急诊科TBI患者的凝血功能障碍风险,具有高判别能力和临床实用性。中性粒细胞百分比、A/G比和ALT在预测中起关键作用,表明炎症和肝功能失调是凝血病的重要驱动因素。尽管存在一定局限性,该模型为急诊医学的精准风险分层提供了新工具,为改善TBI患者预后奠定了基础。
生物通微信公众号
知名企业招聘