利用集成机器学习模型(Super Learner)预测小型颅内动脉瘤破裂风险:在中国两家三级医院进行的回顾性研究
《International Journal of General Medicine》:Predictions of Small Intracranial Aneurysms’ Rupture Risk with Ensemble Machine Learning Model (Super Learner): A Retrospective Study in Two Tertiary Hospitals in China
【字体:
大
中
小
】
时间:2025年11月04日
来源:International Journal of General Medicine 2
编辑推荐:
基于形态学、临床及血流动力学参数,本研究构建并验证了Super Learner集成模型以预测脑动脉瘤破裂风险。该模型整合SVM、随机森林、XGBoost等5种机器学习算法,通过10折交叉验证确定最优权重组合,在内外部验证队列中均表现优异(外部AUC 0.94),优于单一模型。关键参数包括血压水平、动脉瘤不规则形态、血流剪切应力(WSSmin)及收缩期峰值流速(SR),其贡献趋势通过可解释性分析可视化呈现。模型在小型未破裂动脉瘤风险评估中展现出临床价值,为个体化治疗决策提供量化依据。
颅内动脉瘤是一种常见的脑血管疾病,其破裂可能导致蛛网膜下腔出血(SAH),这是一种具有极高致死率和致残率的严重病症。因此,准确预测动脉瘤破裂风险对于指导治疗决策、改善患者预后具有重要意义。近年来,随着医学影像技术和计算流体动力学(CFD)的发展,研究人员能够从更广泛的临床、形态学和血流动力学参数中提取信息,以更全面地评估动脉瘤破裂的可能性。然而,传统风险评估工具往往缺乏足够的精度和灵活性,难以满足个体化风险预测的需求。在此背景下,机器学习(ML)作为一种强大的数据驱动分析工具,被广泛应用于医学预测领域,展现出处理复杂数据模式和非线性关系的能力。本研究旨在构建一个集成机器学习模型——超级学习者(Super Learner),以提升对颅内动脉瘤破裂风险的预测能力,并通过外部验证确保其临床适用性。
本研究采用回顾性设计,收集了两家医院中2021年至2023年间接受治疗的225例颅内动脉瘤患者的临床数据。研究团队首先利用数字减影血管造影(DSA)和计算机断层扫描血管造影(CTA)确认了动脉瘤的存在,并对患者的基本信息、动脉瘤的形态特征以及血流动力学参数进行了系统分析。具体而言,患者数据被划分为训练集(97例)、内部验证集(42例)和外部验证集(86例),以确保模型的稳定性和泛化能力。在训练集中,研究人员通过LASSO算法结合10折交叉验证筛选出关键建模变量,并进一步排除了存在高度共线性的参数,以提高模型的解释性和准确性。
构建的模型包括五种基础机器学习算法——决策树(DT)、K近邻(KNN)、随机森林(RF)、支持向量机(SVM)和极端梯度提升(XGBoost),以及一个基于这些基础模型的集成模型——超级学习者(Super Learner)。该模型通过交叉验证确定最佳的模型组合策略,从而在不同数据集上实现更稳健的预测效果。在内部验证集中,超级学习者模型的AUC值为0.86,随机森林为0.73,XGBoost为0.89,SVM为0.89,决策树为0.89,KNN为0.53。而在外部验证集中,超级学习者模型的AUC值达到0.94,显著优于其他模型,随机森林为0.83,XGBoost为0.93,SVM为0.82,决策树为0.84,KNN为0.51。这一结果表明,超级学习者模型在预测颅内动脉瘤破裂风险方面具有更高的准确性和稳定性。
模型的解释性分析进一步揭示了影响动脉瘤破裂的关键因素。在外部验证集中,高血压、不规则形态、较大的SR值以及较低的WSSmin被识别为显著增加破裂风险的变量。这些发现与既往研究结果一致,即慢性高血压可能导致动脉瘤扩张和血管壁强度下降,从而增加破裂概率。不规则形态的动脉瘤可能因内部血流紊乱而更容易破裂,较大的SR值(动脉瘤与颈部的比值)通常意味着动脉瘤体积较大,这与较高的破裂风险相关。而极低的WSSmin(最小壁剪切应力)则可能引发局部炎症反应,从而触发动脉瘤破裂。这些因素的识别不仅增强了模型的临床实用性,也提供了更深入的生物学理解,有助于医生在临床实践中更准确地评估患者的风险。
尽管超级学习者模型在外部验证中表现出色,但研究团队也注意到其在训练集中达到AUC值为1.00,这可能意味着模型在训练数据上存在一定的过拟合风险。为应对这一问题,研究者采用了分层的10折交叉验证方法,以增强模型的鲁棒性。此外,超级学习者模型通过整合多种基础算法,有效降低了对单一模型的依赖,从而减少了过拟合的可能性。更重要的是,模型在内部和外部验证集中的表现均保持稳定,这表明其具备良好的泛化能力,能够适用于不同人群和医疗环境。
在临床应用方面,该模型对小动脉瘤(直径小于7毫米)的破裂风险预测尤为有价值。由于小动脉瘤的破裂风险相对较低,但并非完全排除,因此在治疗决策中常常面临较大的不确定性。超级学习者模型的引入为这类患者提供了一种量化、个体化的风险评估工具,帮助医生在缺乏明显高风险特征的情况下,更科学地判断是否需要进行早期干预或加强随访。同时,该模型的持续优化能力也使其能够适应未来新增病例的数据,从而实现模型性能的不断提升和临床价值的增强。
研究团队在方法学上采取了多种措施,以确保模型的准确性和可靠性。首先,所有数据均经过严格的质控流程,排除了影像质量不佳或临床信息不完整的病例,从而减少了数据偏差。其次,模型构建过程中采用了LASSO算法进行特征选择,并通过交叉验证优化模型权重,确保模型在不同数据集上的稳定性。此外,研究还强调了模型的可解释性,通过标准化各变量并将其与不同风险等级进行对比,揭示了每个变量在预测动脉瘤破裂中的具体作用。这种解释性分析不仅提升了模型的临床适用性,也为未来的研究提供了更清晰的方向。
尽管本研究取得了令人瞩目的成果,但也存在一些局限性。首先,样本量相对较小,仅包含150例病例,这可能影响模型的泛化能力。因此,未来的研究需要扩大样本规模,以进一步验证模型的有效性。其次,超级学习者模型本质上是一个“黑箱”模型,其内部机制较为复杂,难以直观解释预测结果。为了提高模型的透明度和可解释性,研究者建议未来可以结合更先进的解释性算法,如SHAP(Shapley Additive Explanations)或LIME(Local Interpretable Model-agnostic Explanations),以帮助临床医生更好地理解模型的预测逻辑。
综上所述,本研究构建的超级学习者模型在预测颅内动脉瘤破裂风险方面表现出显著的优势,其在外部验证集中的AUC值高达0.94,远高于其他基础模型。通过整合多种机器学习算法并采用交叉验证优化模型权重,该模型不仅提升了预测的准确性,还增强了稳定性。同时,模型的可解释性分析为临床决策提供了重要的依据,有助于医生在实际工作中更好地应用这一工具。然而,研究仍需进一步扩大样本量,并探索更高效的模型解释方法,以全面推动其在临床实践中的应用。未来的研究可以结合更多临床数据和血流动力学参数,进一步完善模型的预测能力,使其成为颅内动脉瘤管理的重要辅助工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号