开发并验证可解释的机器学习模型以预测手指再植后坏死的风险:一项回顾性多中心研究

《Injury》:Development and validation of interpretable machine learning models for predicting the risk of necrosis after finger replantation: a retrospective multicenter study

【字体: 时间:2025年11月21日 来源:Injury 2.2

编辑推荐:

  指尖再植术后坏疽风险预测模型的构建与验证。基于1579例患者数据,通过LASSO回归和Boruta算法筛选关键特征(包括D-二聚体、中性粒细胞计数、血小板等),采用梯度提升机(GBM)模型,内部验证AUC达0.978,外部验证AUC为0.983,开发了可解释的Web计算平台。

  本研究聚焦于手指再植手术后数字坏死(DN)这一重要并发症,旨在通过构建并验证一种易于理解的机器学习模型,提高对DN风险的预测能力。数字坏死不仅影响患者的手部功能,还对心理状态和经济负担产生显著影响,因此,及时识别和干预DN风险对于改善患者预后具有重要意义。目前,临床实践中主要依赖于外科医生的主观判断和经验,缺乏客观、精准的预测工具。为此,本研究引入机器学习技术,结合术后实验室数据,以期为临床决策提供科学依据。

研究团队从苏州大学附属苏州瑞华骨科医院收集了1579例接受手指再植手术的患者数据,其中一部分用于训练模型,另一部分作为内部验证集。为了增强模型的泛化能力,还引入了来自其他两个机构的293例数据作为外部验证集。通过比较多种机器学习方法,如梯度提升机(GBM)、随机森林(RF)、神经网络、支持向量机(SVM)等,研究最终选择了GBM模型作为最优模型。GBM在训练集和内部验证集中的预测能力均表现出色,其AUC值分别为0.995和0.978,而在外部验证集中也保持了较高的预测精度(AUC: 0.983)。此外,研究团队利用SHAP算法对模型进行了全局和局部解释,以帮助医生更好地理解各特征对DN预测的影响。为了便于临床应用,还开发了一个基于该模型的网络计算平台,供医生在日常工作中使用。

在模型构建过程中,研究团队采用了一种综合方法,包括使用LASSO回归和Boruta算法进行特征选择。这些方法能够有效识别与DN发生显著相关的特征,如医生经验、中性粒细胞计数、血管危象、系统免疫炎症指数(SII)、血小板计数、动脉静脉比例等。通过这些特征的综合分析,模型能够更全面地反映术后DN的潜在风险因素。LASSO回归通过引入惩罚项,有助于在大量特征中筛选出关键变量,而Boruta算法则通过随机生成“影子特征”与原始特征进行对比,从而识别出对模型输出具有显著影响的变量。最终,结合两种方法筛选出的九个变量被用于构建预测模型。

研究结果表明,这九个变量在DN的发生中具有独立预测价值。其中,医生经验、中性粒细胞计数、血小板计数、血管危象、SII、损伤数量、动脉静脉比例和中性粒细胞百分比等被证明是影响DN风险的关键因素。值得注意的是,尽管医生经验在某些研究中被认为是术后恢复的重要因素,但本研究进一步验证了其在预测DN中的独立作用。此外,中性粒细胞计数和百分比以及SII等免疫炎症指标在模型中展现出显著的预测价值,这与血管损伤后免疫反应增强有关。

GBM模型在训练集和验证集中的表现均优于其他模型。其在训练集中的AUC值为0.995,内部验证集为0.978,外部验证集为0.983,显示出极高的预测准确性。同时,研究还通过校准曲线、决策曲线分析(DCA)和敏感性分析等方法验证了模型的可靠性。DCA分析显示,GBM模型在临床应用中具有更高的净收益,意味着其在实际应用中能够提供更实用的预测结果。校准曲线则表明,模型预测的DN风险与实际观察结果之间具有良好的一致性,进一步支持了其临床适用性。

SHAP算法的应用使得模型的可解释性得到了显著提升。通过全局解释,研究团队发现D-二聚体水平、中性粒细胞计数、血小板计数、医生经验、中性粒细胞百分比、SII、损伤数量、动脉静脉比例和血管危象是影响DN风险的主要因素。其中,D-二聚体和血小板计数的升高可能与术后血管危象的发生相关,而医生经验的提升则有助于降低DN风险。此外,中性粒细胞计数和百分比的增加可能表明术后炎症反应增强,从而增加DN的发生概率。这些发现不仅为医生提供了更直观的解释,也为临床干预提供了明确的方向。

在模型的局部解释中,研究团队展示了不同患者个体的特征如何影响其DN风险预测。例如,某位患者的中性粒细胞计数较高,而医生经验较低,这些特征可能显著增加其术后DN的风险。相反,若某位患者的血小板计数正常,且由资深医生进行手术,则其DN风险可能较低。这种个性化的预测能力有助于医生更精准地评估每位患者的风险,并制定相应的干预措施。

本研究的创新之处在于其将机器学习与临床数据相结合,构建了一个能够预测手指再植术后DN风险的模型。与传统的单一统计方法相比,机器学习模型在处理复杂数据关系和提高预测准确性方面表现出显著优势。此外,该模型的可解释性使得医生能够更好地理解其预测逻辑,从而增强临床信任度和应用价值。模型的构建不仅依赖于术前和术中数据,还考虑了术后实验室指标,这在以往的研究中较为少见。这种全面的数据整合方式有助于更准确地捕捉术后DN的风险因素。

尽管本研究取得了重要进展,但仍存在一定的局限性。例如,研究未纳入影像学数据,如吲哚青蓝绿荧光造影和红外热成像等,这些数据可能对DN的早期识别具有重要价值。未来的研究可以考虑将影像学数据与实验室数据相结合,构建多模态融合模型,以进一步提高预测的准确性和效率。此外,模型的泛化能力仍需在更大规模的患者群体中进行验证,以确保其在不同医疗机构中的适用性。

本研究的结论强调了构建一个易于理解和应用的机器学习模型在预测手指再植术后DN风险中的重要性。GBM模型在训练集和外部验证集中均表现出色,能够为医生提供可靠的预测结果。同时,开发的网络计算平台使得医生能够在日常工作中快速评估患者的DN风险,从而实现早期干预和治疗优化。这一成果不仅为手指再植手术的术后管理提供了新的工具,也为未来研究指明了方向,即如何通过整合更多临床数据和先进技术,进一步提高DN风险预测的准确性和实用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号