基于LASSO回归(Least Absolute Shrinkage and Selection Operator regression)机器学习模型鉴别脊柱结核、化脓性脊椎炎与终板骨软骨炎:开发与临床应用

《Frontiers in Cellular and Infection Microbiology》:LASSO regression-based machine learning model for differentiating spinal tuberculosis, pyogenic spondylitis, and endplate osteochondritis: development and clinical application

【字体: 时间:2026年06月03日 来源:Frontiers in Cellular and Infection Microbiology 4.8

编辑推荐:

  摘要:引言:由于临床及影像学表现重叠,脊柱结核(spinal tuberculosis, STB)、化脓性脊椎炎(pyogenic spondylitis, PS)与终板骨软骨炎(endplate osteochondritis)的准确鉴别仍是临床难题。本研究

  
摘要:引言:由于临床及影像学表现重叠,脊柱结核(spinal tuberculosis, STB)、化脓性脊椎炎(pyogenic spondylitis, PS)与终板骨软骨炎(endplate osteochondritis)的准确鉴别仍是临床难题。本研究旨在构建并验证可解释的机器学习模型,辅助这三种常见易混淆脊柱疾病的鉴别诊断。方法:回顾性纳入柳州市人民医院2020年6月至2024年12月共481例患者,包括STB 247例、PS 92例、终板骨软骨炎142例。所有受试者按7:3随机分为训练队列(n=338)与内部验证队列(n=143)。全面评估6种机器学习算法,基于筛选出的12个核心特征构建最优LASSO回归模型。采用SHAP(SHapley Additive exPlanations)分析阐释全局特征重要性及个体预测贡献。此外,开发了开放获取的基于网页的预测计算器以辅助临床决策。结果:在验证队列中,LASSO模型对STB、PS和终板骨软骨炎的AUC分别为0.838、0.683和0.897。SHAP分析量化了各特征的预测贡献并增强了模型可解释性。成功构建了便于使用的在线预测工具供临床辅助使用。结论:本研究建立了可解释的机器学习模型及配套网页计算器。该模型对脊柱结核和终板骨软骨炎具有良好的诊断效能,可为三种脊柱疾病的临床鉴别诊断提供实用的辅助工具。
论文解读:《基于LASSO回归机器学习模型鉴别脊柱结核、化脓性脊椎炎与终板骨软骨炎:开发与临床应用》
该研究由研究人员发表于《Frontiers in Cellular and Infection Microbiology》。目前,脊柱结核(STB,亦称Pott病)、化脓性脊椎炎(PS)及终板骨软骨炎(即Modic改变,MC)因临床表现隐匿且MRI等影像学征象重叠,仅凭临床、实验室及常规影像难以可靠鉴别。金标准(病原学或病理活检)具侵入性且耗时,现有辅助诊断人工智能模型多为二分类(如仅区分STB与PS),无法反映临床需同时排除多种竞争诊断的真实场景,且所评估算法种类有限。为此,研究人员开展了基于多分类(三分类)机器学习框架的回顾性诊断研究,利用易于获取的临床常规检验指标构建并验证LASSO回归(Least Absolute Shrinkage and Selection Operator regression)模型,开发在线计算器,以期为早期鉴别诊断提供客观辅助工具。最终研究人员得出结论:基于12项常规临床指标的LASSO多分类模型对STB(验证集AUC 0.838)和终板骨软骨炎(AUC 0.897)判别效能良好,对PS判别为中等(AUC 0.683),模型经校准与决策曲线分析具临床净获益,并部署为可公开访问的网络计算工具。
主要关键技术方法:
研究人员回顾性收集柳州市人民医院2020年6月至2024年12月符合金标准确诊的481例三类脊柱疾病患者(STB 247例、PS 92例、终板骨软骨炎142例),按7:3分层随机分为训练队列(n=338)与内部验证队列(n=143)。初始纳入50项临床变量,通过1000次Bootstrap重抽样下重复运行LASSO回归筛选稳定特征,比较Top 10/12/15特征子集构建多分类模型;同时对比LASSO回归、K近邻(KNN)、随机森林(RF)、极端梯度提升(XGBoost)、决策树(DT)及岭回归(Ridge Regression)六种算法(1000次Bootstrap),依AUC及准确率选定最优模型。最终模型采用λmin惩罚参数,通过校准曲线、决策曲线分析(DCA)评价性能,应用SHAP值进行全局与局部可解释性分析,并将最优模型封装为Shiny架构在线网页预测工具。
研究结果
3.1 患者基线特征
研究人员对三组患者的50项基线指标行组间比较,STB、PS与终plate骨软骨炎组在炎症、营养及血常规等指标上存在统计学差异,为后续建模提供异质性基础。
3.2 多种机器学习模型性能评估
六类算法经1000次Bootstrap评估,LASSO回归被最频繁选为最优模型。进一步比较λmin与λ1se(one-standard-error rule)构建的LASSO模型,λmin模型在训练集与验证集的准确率及AUC均优于λ1se模型,故采用λmin。经比较Top 15、Top 12、Top 10特征子集,Top 12特征模型在多数评价指标上最优且兼顾简洁性,确定为最终特征集。训练集AUC分别为STB 0.834、PS 0.764、终板骨软骨炎 0.863;验证集AUC分别为0.838、0.683、0.897。校准曲线Hosmer-Lemeshow检验P均>0.05,提示预测概率与观察结果吻合良好;DCA显示模型在阈值概率0.0–0.8内较"全部治疗"及"全部不治疗"策略具更高净临床获益。
3.3 基于SHAP的LASSO回归可解释性分析
全局SHAP条形图显示白球比(AGR)、红细胞沉降率(ESR)、单核细胞绝对值(MONO)平均绝对SHAP值最高,为最重要预测因子。SHAP摘要散点图阐明各特征对三分类预测的正负影响方向。个体SHAP力图(force plot)展示单例患者各指标如何将基线预期概率偏移至最终预测类别,实现个案水平透明化解读。
3.4 在线交互式临床决策支持工具的开发
研究人员将最终含12项常规指标(血清钠、单核细胞比率[MONO_P]、单核细胞绝对值[MONO]、间接胆红素[IBIL]、年龄、ESR、淋巴细胞绝对值[LYMPH]、尿酸[UA]、白蛋白[ALB]、白球比[AGR]、红细胞分布宽度变异系数[RDW-CV]、血小板压积[PLCR])的LASSO模型部署为免费在线预测计算器(https://liangtuo1234.shinyapps.io/Spine_Disease_Prediction/),供临床输入参数后实时输出三类疾病风险概率。
讨论与结论翻译
讨论部分指出本研究首次以常规血液及炎症指标实现STB、PS与终板骨软骨炎的三分类同时鉴别,弥补既往二分类局限;但受单中心回顾性设计、PS组样本量偏小致组间不均衡影响,PS亚组AUC仅0.683属中等,模型普适性需多中心外部前瞻性验证完善。筛选出的12项核心特征涵盖炎症(MONO、ESR等)、营养代谢(ALB、AGR、UA)、血细胞参数(LYMPH、RDW-CV、PLCR)及人口学年龄,具合理病理生理学依据;SHAP分析验证模型决策逻辑之临床合理性。
结论(Conclusion):本研究基于易获取的临床实验室参数构建了用于鉴别STB、PS与终板骨软骨炎的可解释三分类机器学习模型。该模型对STB和终板骨软骨炎具有可接受的诊断效能,而对PS的预测能力因样本分布不均处于中等水平。研究人员进一步开发了简易在线预测工具以辅助临床决策。在充分认识单中心回顾性设计、PS样本不足及缺乏外部验证等局限性的前提下,本研究仍为三种易混淆脊柱疾病的鉴别诊断提供了初步探索性参考。未来应扩大至多中心样本并进行外部验证,以进一步优化模型性能并确认其临床实用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号