基于三阶段机器学习模型的蛛网膜下腔出血严重程度预测：解决罕见结局预测挑战的创新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月11日 来源：Neurosurgical Review 2.5

编辑推荐：

　　本研究针对蛛网膜下腔出血(SAH)严重程度预测中数据不平衡的核心难题，创新性地采用改良Rankin量表(MRS)三阶段分类框架。研究人员通过随机森林特征选择筛选出20个关键预测因子，在535例患者队列中验证了13种机器学习模型性能，最终实现"良好预后"(MRS 0-3)和"不良预后"(MRS 4-6)的二元分类准确率达90%，细分阶段分类准确率分别达88%和86%。该研究为临床SAH精准分层诊疗提供了可靠决策工具。

蛛网膜下腔出血(SAH)作为最具破坏性的卒中类型之一，每年导致全球约10/10万人的发病，其突发性致死致残特征给临床决策带来巨大挑战。尽管现代影像技术能快速诊断SAH，但准确预测患者预后仍是神经重症领域的"阿喀琉斯之踵"——传统评分系统如Hunt-Hess量表和Fisher分级往往在罕见严重病例(MRS 5-6级)预测中表现乏力，这种"多数类偏见"现象使得临床医生难以对高风险患者实施精准干预。

Hamad Medical Corporation神经外科团队在《Neurosurgical Review》发表的研究中，开创性地将机器学习与三阶段分类策略相结合。研究人员首先通过随机森林算法从37个临床特征中筛选出最具预测力的20个指标，包括格拉斯哥昏迷评分(GCS)、Fisher评分和序贯器官衰竭评估(SOFA)评分等关键参数。随后采用SMOTE技术解决数据不平衡问题，构建了包含Extra Trees、随机森林等13种算法的评估体系，最终在535例SAH患者队列中实现90%的二元分类准确率，为临床提供了可靠的预后预测工具。

关键技术方法包括：1)从Hamad General Hospital电子健康记录中收集535例SAH患者的多维度临床数据；2)采用随机森林特征选择确定TOP20预测因子；3)应用SMOTE和5折交叉验证解决数据不平衡问题；4)建立三阶段分类框架（先二元分类再细分MRS亚组）；5)通过SHAP值解析模型决策机制。

研究结果揭示：

特征选择：
显示Fisher评分、GCS和H&H评分在三阶段分类中均保持核心地位，而血小板计数(PLT)等实验室指标呈现阶段特异性重要性。
模型性能：

第一阶段：Extra Trees模型在区分"良好预后"(MRS 0-3)与"不良预后"(MRS 4-6)时表现最优，准确率达90.09%，AUC值96.04%。
第二阶段：随机森林对MRS 0-3亚组的细分准确率达88%，但存在20%的MRS 2级误判为1级，反映轻度神经功能缺损的鉴别挑战。
第三阶段：对MRS 4-6重症患者的分类准确率降至86%，其中53%的死亡病例(MRS 6)被误判为重度残疾(MRS 5)，凸显极端病例预测的固有难度。

可解释性分析：SHAP值解析显示GCS₁（入院时GCS评分）和脑积水是影响预测的最强特征，这与临床认知高度一致。

讨论部分指出，该研究的创新价值在于：1)首次将三阶段分类框架应用于SAH预后预测，有效缓解了"类别不平衡诅咒"；2)通过SMOTE与集成学习的协同应用，将罕见重症病例的识别率提升40%；3)建立的预测模型可直接整合至电子病历系统，实现床边实时风险评估。局限性包括：1)样本中MRS 6级病例仅15例，可能影响模型泛化能力；2)未纳入影像组学等新兴特征。

这项由Muhammad Mohsin Khan和Adiba Tabassum Chowdhury领衔的研究，为SAH精准医疗提供了重要方法论突破。其构建的预测框架不仅适用于神经重症监护室的资源调配决策，更为重要的是，使临床医生能在"黄金救治时间窗"内识别那些看似稳定但实则高危的"伪装者"患者——这对改善全球SAH患者预后具有重大实践意义。未来研究可通过多中心验证进一步优化模型，并探索深度学习在罕见结局预测中的潜力。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号