编辑推荐:
为解决急性脊髓损伤(ASCI)神经功能恢复早期预测难题,研究人员开展多模态数据(临床、影像、实验室)整合的机器学习建模研究,构建 10 种模型并经 SHAP 分析,发现高斯朴素贝叶斯(GNB)模型表现最佳,为个性化诊疗提供新工具。
急性脊髓损伤(ASCI)如同突然降临的灾难,会瞬间击碎患者的正常生活,导致严重的神经功能缺损,使患者生活质量大幅下降。而早期准确预测神经功能恢复情况,对于制定个性化治疗方案至关重要。然而,当前的 ASCI 预测模型面临诸多挑战:传统机器学习方法如逻辑回归、随机森林等虽有一定的 interpretability 和计算效率,但依赖手动特征选择,容易遗漏数据中的复杂模式;深度学习方法如卷积神经网络虽擅长处理高维复杂数据,却需要大量标注数据和计算资源,在医疗领域数据获取和标注成本高昂的情况下难以广泛应用。此外,现有模型在预测准确性、泛化能力以及可解释性方面都存在不足,临床适用性有待提高。
为了突破这些困境,西安交通大学附属红会医院联合北京大学第三医院等机构的研究人员开展了一项具有创新性的研究。他们致力于开发一种基于多模态数据的机器学习模型,以更准确、可解释地预测 ASCI 患者的神经功能恢复情况。这项研究成果发表在《Scientific Reports》上,为 ASCI 的诊疗带来了新的希望。
研究人员开展的主要关键技术方法如下:研究纳入了 387 例 ASCI 手术患者作为研究队列,收集了临床数据(如年龄、性别、AIS 分级、IMLL 等)、实验室数据(如 INR、BMI、Cys C、RDW-CV 等)以及 142 例患者的术前 T2 加权脂肪抑制 MRI 影像数据。通过单变量分析、Lasso 回归等特征选择技术,从临床、影像组学和实验室数据中筛选出关键特征。构建了包括 XGBoost、Logistic Regression、KNN、SVM、Decision Tree、Random Forest、LightGBM、ExtraTrees、Gradient Boosting 和 Gaussian Naive Bayes(GNB)在内的多种机器学习模型,采用网格搜索和交叉验证优化模型超参数,并利用 Stacking 方法进行模型集成。运用 SHAP 分析评估特征重要性,通过层次聚类对患者进行分组,还构建了静态和动态列线图以辅助临床预测。
研究结果
描述性统计与特征选择
对 387 例患者的基线特征分析显示,神经功能改善组和未改善组在 AIS 分类、IMLL、PRA 分类和 RDW-CV 等方面存在显著差异。通过 Lasso 回归从临床和实验室数据中筛选出 IMLL、PRA、CW、eGFR、Cys C、INR、RDW-CV、Urea 和 BMI 等关键特征;从 MRI 影像中提取的 1690 个影像组学特征,经预处理和 Lasso 回归后,筛选出 6 个关键影像组学特征,如 original_glszm_SizeZoneNonUniformity、waveletHLL_glcm_SumEntropy 等。
模型构建与评估
在仅使用临床和实验室数据的分析中,Gradient Boosting 模型表现最佳,准确率为 0.75,AUC 为 0.79。当纳入多模态影像组学数据后,GNB 模型表现优异,AUC 达到 0.90,准确率为 0.80,显著高于其他模型。研究还发现,整合影像组学与其他数据可显著提高 AUC 值,全特征组合时 AUC 最高。
模型解释性与特征重要性
SHAP 分析表明,影像组学特征 original_glszm_SizeZoneNonUniformity、wavelet-LLL_glrlm_LongRunHighGrayLevelEmphasis 和 lbp-3D-k_glszm_GrayLevelNonUniformity 是影响模型预测的重要因素,临床特征 IMLL 和 RDW-CV 也具有重要作用。分析还确定了多个特征的关键阈值,如 IMLL≥62 mm、BMI<22.5 等,这些阈值与神经功能恢复密切相关。
患者聚类与列线图分析
基于 SHAP 值的层次聚类将患者分为两个具有不同临床和影像组学特征的亚组,为个性化治疗提供了依据。构建的列线图整合了关键临床和影像组学特征,可直观预测神经功能恢复概率,动态列线图还能实现实时预测,提高了模型的临床实用性。
研究结论与讨论
本研究成功构建了一种整合多模态数据的可解释机器学习模型,该模型在 ASCI 神经功能恢复预测中表现出色,尤其是 GNB 模型展现出较高的准确性和可靠性。影像组学特征的加入显著提升了模型性能,表明多模态数据融合在医学预测中的重要价值。SHAP 分析和列线图的应用增强了模型的可解释性,使临床医生能够更好地理解模型决策过程,有助于个性化治疗方案的制定。
然而,研究也存在一定局限性,如样本量相对较小、缺乏外部验证等。未来需扩大样本量并开展多中心研究,以进一步验证模型的可靠性和泛化能力。尽管如此,该研究为 ASCI 的预后评估和个性化治疗提供了新的工具和思路,有望在临床实践中发挥重要作用,推动 ASCI 诊疗向更精准、更个性化的方向发展。