基于可解释机器学习的失代偿期肝硬化患者早期再入院预测模型构建与验证：一项前瞻性两中心队列研究

《BioData Mining》：Construction and validation of a machine learning-based model predicting early readmission in patients with decompensated cirrhosis: a prospective two-center cohort study

【字体：大中小】 时间：2025年09月26日 来源：BioData Mining 6.1

编辑推荐：

　　为解决失代偿期肝硬化患者30天内再入院率高、传统评分系统预测效能不足的问题，研究人员开展了一项基于可解释机器学习（ML）的前瞻性两中心队列研究。通过11种ML算法比较，发现随机森林（RF）模型性能最佳，最终构建的7特征模型在内外验证中AUC分别达0.853和0.838，并开发在线工具实现临床转化。该研究为肝硬化患者早期风险分层提供了精准、可解释的预测工具。

对于失代偿期肝硬化患者而言，出院后的"回旋镖"现象——即早期再入院，始终是悬在患者和医疗系统头上的达摩克利斯之剑。据统计，北美地区患者30天内再入院率高达40%，而在东亚国家则为5.6%-7.2%。这种差异不仅反映了疾病管理的区域性特点，更凸显了预测工具的重要性。传统上，临床医生依赖Child-Turcotte-Pugh（CTP）评分和终末期肝病模型（MELD）等指标来评估患者预后，但这些工具在预测短期再入院方面显得力不从心，缺乏足够的敏感性和特异性。随着人工智能时代的到来，机器学习技术为这一难题带来了新的曙光，但"黑箱"问题又成为临床应用的绊脚石。

在这一背景下，Yang等人发表在《BioData Mining》上的研究开创性地将可解释人工智能（XAI）理念引入肝硬化患者管理领域。研究团队开展了一项前瞻性两中心队列研究，旨在构建并验证一个既能准确预测又易于解读的机器学习模型，为临床医生提供可靠的决策支持工具。

研究人员采用多阶段建模策略，首先从电子健康记录（EHR）中提取了三类共21个临床特征，包括 demographics、实验室指标和肝硬化相关参数。通过11种机器学习算法的系统比较，发现随机森林（RF）模型表现出最优的预测性能。进一步利用SHapley Additive exPlanation（SHAP）方法进行特征筛选和模型解释，最终得到一个包含7个关键特征的简约模型。研究还纳入了来自两个医疗中心的786例患者进行模型训练和验证，并开发了在线应用工具促进临床转化。

研究结果

基线特征显示，在636例发现样本中，30天再入院率为8.5%。与未再入院组相比，再入院患者具有更高的总胆红素（TBIL）、肌酐、乳酸脱氢酶（LDH）水平，以及更高的中性粒细胞-淋巴细胞比值（NLR）和血小板-淋巴细胞比值（PLR），而淋巴细胞-单核细胞比值（LMR）较低。同时，再入院患者的CTP评分和MELD-Na评分显著更高，肝性脑病（HE）和感染的发生率也更高。

模型开发与性能比较发现，在11种机器学习算法中，随机森林（RF）在训练集和测试集中均表现最佳，曲线下面积（AUC）分别达到0.982和0.853。梯度提升机（GBM）和朴素贝叶斯模型分别以0.818和0.808的AUC值位列二、三位。交叉验证结果进一步证实了RF模型的稳健性，五折和十折交叉验证的平均AUC分别为0.70±0.08和0.72±0.11。

最终模型确定过程通过特征降维实现了模型优化。21特征模型与7特征模型的性能相当（ΔAUC：0.01，P=0.883），但后者更具临床实用性。最终模型包含NLR、丙氨酸氨基转移酶（ALT）、衰弱表型、体重指数（BMI）、碱性磷酸酶（ALP）、LMR和PLR七个特征，在测试集中的AUC为0.843（特异性0.763，敏感性0.9，准确率0.773）。与传统评分系统相比，最终模型显著优于MELD-Na（ΔAUC：0.439，P<0.001）和CTP评分（ΔAUC：0.168，P<0.001）。

模型外部验证表明，最终模型在150例独立外部验证队列中表现出良好的泛化能力，AUC达到0.838，与内部验证结果无显著差异（ΔAUC：0.005，P=0.956）。

模型解释性分析通过SHAP方法实现。全局解释显示，NLR是影响预测的最重要特征，其临界值为5.92；LMR的临界值为1.90。衰弱表型的存在推动预测向"早期再入院"方向偏移。BMI呈现U型关系，过低（≤17.6 kg/m²）或过高（≥25.0 kg/m²）均增加再入院风险。局部解释通过个案力力图直观展示各特征对个体预测的贡献度，增强了模型的可解释性。

临床转化应用方面，研究团队基于Streamlit框架开发了在线网页应用（http://192.168.3.111:8501），临床医生输入7个特征值即可快速获取患者的再入院风险概率及决策依据可视化。

预后验证分析将全部786例患者按预测模型结果和实际随访结果分为四个亚组。结果显示，预测模型阳性且实际再入院的患者（亚组4）基础肝病严重程度最重，衰弱表现最明显。值得注意的是，预测模型阳性但未发生再入院的患者（亚组2）也显示出较高的MELD-Na评分和衰弱发生率，提示该模型可能识别出潜在的高危人群。

研究结论与讨论

这项研究成功构建了一个基于可解释机器学习的失代偿期肝硬化患者早期再入院预测模型，在保持较高预测准确性的同时，通过SHAP方法有效解决了机器学习模型的"黑箱"问题。最终确定的7特征随机森林模型不仅性能显著优于传统评分系统，而且具有良好的临床实用性和可解释性。

研究的创新之处在于将系统性免疫炎症标志物（NLR、LMR、PLR）和衰弱表型等新型指标纳入预测体系，这些指标更好地反映了肝硬化患者的全身炎症状态和生理储备功能。特别是衰弱表型作为一个多维综合指标，涵盖了日常活动能力、共病情况、用药负担和社会支持等多个维度，与健康相关生命质量（HRQoL）密切相关，为理解再入院的病理生理机制提供了新视角。

然而，研究也存在一定局限性。8.5%的再入院率低于北美报道，可能与纳入标准严格限定肝硬化相关再入院有关。模型未包含隐匿性感染等潜在重要预测因子，且主要基于中国人群数据，外推性需进一步验证。尽管模型性能达到中等准确水平（AUC约0.8），但在更大人群中的验证仍有必要。

从临床实践角度，该模型的价值不仅在于预测准确性，更在于其提示的可干预靶点。抗病毒治疗、营养支持、感染预防等多学科干预措施可能改善高危患者的预后。在线工具的开发极大促进了模型的临床转化，为个体化医疗提供了技术支持。

未来研究可探索该模型在指导资源分配、优化出院后随访策略方面的应用价值，并通过随机对照试验验证基于模型风险分层的干预措施能否有效降低再入院率，减轻医疗系统负担。随着可解释人工智能技术的不断发展，机器学习模型在临床决策支持中的作用将日益凸显，为肝硬化患者管理提供更精准、透明的解决方案。

热点排行