基于机器学习的HBV相关代偿性晚期慢性肝病患者肝细胞癌风险预测模型构建与验证

【字体: 时间:2025年10月08日 来源:Journal of Cancer Research and Clinical Oncology 2.8

编辑推荐:

  本研究针对HBV相关代偿性晚期慢性肝病(cACLD)患者肝细胞癌(HCC)风险预测需求,通过机器学习算法构建了高性能预测模型。研究团队利用LASSO回归、随机森林(RF)和支持向量机(SVM)进行特征筛选,最终确定肝脏硬度测量(LSM)、年龄、血小板(PLT)、胆汁酸和白细胞计数(WBC)五个关键预测因子。其中RF模型表现最优,在验证队列中曲线下面积(AUC)达0.956,灵敏度为0.808。SHAP可解释性分析揭示LSM是最重要预测因子(平均SHAP值1.2),并发现LSM与PLT、胆汁酸间存在显著协同效应。该模型为cACLD患者的HCC风险分层管理提供了重要工具。

  
在全球范围内,慢性乙型肝炎病毒(HBV)感染始终是重大的公共卫生挑战,约2.96亿人深受其影响,尤其在亚洲和非洲地区,慢性HBV感染率超过8%。HBV感染可导致慢性肝炎、肝硬化,最终发展为肝细胞癌(HCC)——全球第六大常见恶性肿瘤和第三大癌症相关死亡原因。在亚太地区,超过50%的HCC病例与HBV感染相关,使得HBV相关HCC成为该地区最主要的肝癌类型。特别值得关注的是,处于代偿性晚期慢性肝病(cACLD)阶段的患者,虽然尚未出现明显的肝失代偿体征,但已存在显著的肝纤维化和门静脉高压,这进一步增加了HCC发生风险。
目前,HCC风险预测工具主要包括临床评分系统和非侵入性影像学指标,如纤维化-4指数(FIB-4)、白蛋白-胆红素(ALBI)评分和肝脏硬度测量(LSM)。这些方法在一定程度上反映了肝纤维化程度和肝功能储备情况,但缺乏对多维临床信息的整合能力,特别是在HBV相关cACLD患者中。随着机器学习方法在医学研究中的日益广泛应用,为疾病风险预测提供了新的工具。机器学习能够处理高维数据并探索复杂变量间的非线性关系,在肝病领域已展现出强大潜力,从基于纵向肝脏超声图像的HBV相关慢加急性肝衰竭预后工具,到识别慢性乙型肝炎患者肝硬化的RF模型,再到预测免疫检查点抑制剂治疗后急性肝损伤的模型,机器学习技术正不断推动肝病诊疗的进步。
然而,针对HBV相关cACLD患者的HCC风险预测的机器学习模型仍然较少,且缺乏系统的特征选择和模型解释分析。为了解决这一研究空白,发表在《Journal of Cancer Research and Clinical Oncology》上的这项研究,通过回顾性分析临床队列,构建了基于机器学习的HCC风险预测模型,旨在为HBV相关cACLD患者提供个性化的HCC风险评估工具,并为临床随访和早期干预策略提供科学依据。
研究人员从北京地坛医院2016年1月至2024年4月期间就诊的患者中回顾性纳入了1051例HBV相关cACLD患者,随机分为训练队列(736例)和验证队列(315例)。cACLD的诊断标准为LSM≥10 kPa且无腹水、静脉曲张出血、肝性脑病或黄疸等失代偿体征。所有患者均接受规律抗病毒治疗至少6个月。研究排除了合并其他肝病、入组前已诊断HCC、伴有严重心肺肾功能障碍、接受过肝移植/脾切除/TIPS手术以及妊娠哺乳期妇女和数据不完整的患者。
研究收集了包括人口学特征、肝功能指标、电解质、肾功能、凝血功能、全血细胞计数、血脂谱、甲胎蛋白(AFP)、尿酸和血糖等多维度基线临床数据。影像学检查包括瞬时弹性成像测量的LSM和超声测量的门静脉宽度、脾脏直径和厚度。主要研究终点为HCC的发生,诊断依据美国肝病研究学会指南,包括组织病理学确认、典型的影像学表现(动脉期高增强和门静脉/延迟期洗脱)或AFP显著升高(>400 ng/mL)结合典型影像学表现。
在技术方法上,研究采用三种机器学习特征选择方法(LASSO回归、随机森林和支持向量机)筛选预测因子,基于筛选出的关键特征构建了五种机器学习模型(SVM、RF、逻辑回归、XGBoost和朴素贝叶斯)。模型性能通过曲线下面积(AUC)、准确度、灵敏度、特异性等指标评估,并使用SHAP方法进行模型可解释性分析。此外,研究还进行了生存分析(Cox比例风险回归和随机生存森林模型)以处理HCC发生的时间事件性质。
基线特征
研究纳入的1051例HBV相关cACLD患者中,男性588例(55.9%),中位年龄57.3(50.3-65.9)岁。中位随访时间35(20-55)个月,103例患者(9.8%)发展为HCC。与未发生HCC的患者相比,HCC组患者年龄更大[63.0(55.2-70.0)岁 vs 57.0(49.7-65.4)岁,p<0.001]。辅助检查指标显示,HCC组的ALT、TB、DB、GGT、胆汁酸、PT、INR、脾脏厚度和LSM均高于非HCC组,而ALB、WBC和PLT显著低于非HCC组。两组在其他指标上无显著差异。
特征选择
通过三种机器学习方法进行特征选择,LASSO回归通过10折交叉验证确定最优正则化参数λ,识别出五个特征变量:LSM、年龄、PLT、WBC和胆汁酸。RF模型基于平均基尼不纯度减少值进行特征重要性排序,SVM模型使用平均排名评估特征重要性。venn图分析确定了LASSO回归与RF和SVM前20个特征的交叉点,最终确定五个关键预测因子:LSM、年龄、PLT、胆汁酸和WBC。
机器学习模型性能评估
五种机器学习模型在训练队列中均表现出良好的预测性能。RF模型表现最佳,准确度、召回率、F1分数、灵敏度、特异性、PPV、NPV和AUC分别为0.977、0.808、0.857、0.808、0.993、0.913、0.982和0.979。XGBoost模型性能次之(AUC=0.943),而LR模型的灵敏度和召回率较低(均为0.077)。单独使用LSM进行评估时,其在训练和验证队列中的AUC分别为0.745和0.826,低于RF和XGBoost模型。
ROC曲线分析显示,在训练队列中,RF模型的AUC最高(0.979),其次为XGBoost(0.943)、NB(0.790)、LR(0.777)和SVM(0.764)。在验证队列中,RF模型仍保持最佳性能(AUC=0.956),XGBoost模型的AUC为0.915。决策曲线分析表明,在大多数风险阈值下,RF和XGBoost模型均提供正向净收益,显著优于"全治疗"和"不治疗"策略。
阈值优化分析显示,0.15的概率阈值在临床敏感性和特异性间提供了最佳平衡。在此阈值下,RF模型实现了完美的敏感性(1.00)、特异性0.91、PPV 0.54、NPV 1.00和最高净收益0.0761。校准分析显示RF模型的预测概率与观察概率间具有极好的一致性。
生存分析结果显示,在训练队列中,随机生存森林(RSF)的C-index为0.976,而Cox回归为0.821。RSF的时间依赖性AUC在训练队列中从12个月的0.908到48个月的0.990,而Cox回归表现较为一般(0.726-0.836)。在验证队列中,RSF保持了强劲性能,C-index为0.984,时间依赖性AUC范围从0.866到0.966。
模型可解释性与特征交互作用分析
SHAP特征重要性排名显示,LSM对模型预测贡献最大(平均SHAP值1.2),是影响HCC风险的最重要因素。年龄排名第二(平均SHAP值0.8),反映年龄增长与HCC风险增加密切相关。PLT、WBC和胆汁酸水平也是模型预测的重要贡献因素。
SHAP蜂群图分析进一步揭示了各特征值对模型输出的具体影响。高LSM值主要分布在正SHAP值区域,表明LSM增加显著提高HCC风险。高年龄值也集中在正SHAP值区域,证实高龄是HCC的独立风险因素。值得注意的是,低PLT和WBC值主要位于正SHAP值区域,提示PLT和WBC降低与较高HCC风险密切相关。
特征交互效应分析揭示了关键预测变量间的相互作用模式。LSM与PLT的交互分析显示,当LSM值低于30 kPa时,PLT对SHAP的贡献相对较小且变异有限;但当LSM超过30 kPa时,PLT的影响显著增加,较低的PLT值对应较高的正SHAP值。LSM与胆汁酸的交互分析揭示了相似模式:在LSM较低区域,胆汁酸水平对模型预测的影响相对有限;随着LSM增加,特别是超过30 kPa时,较高的胆汁酸水平与正SHAP值密切相关。PLT与WBC的交互分析显示,当PLT降低时,较低的WBC值往往产生较高的正SHAP值。PLT与胆汁酸的交互进一步证实,高胆汁酸和低PLT的患者显示最高的正SHAP值。
研究结论与意义
本研究构建的基于机器学习的HCC风险预测模型,特别是RF算法,在HBV相关cACLD患者中表现出卓越的预测性能。LSM作为最重要的预测生物标志物,强调了其临床意义。这些模型为个性化风险分层、靶向监测方案和资源高效的医疗提供提供了强有力的循证框架。
研究的创新之处在于首次系统地将机器学习方法应用于HBV相关cACLD患者的HCC风险预测,并通过多方法特征选择确定了五个核心预测因子。RF模型的优异性能(AUC>0.95)明显优于传统单一指标(如LSM单独预测AUC=0.745-0.826),证明了整合多维度临床信息通过机器学习算法能够捕获单指标评估无法实现的复杂特征交互作用。特别值得注意的是特异性阳性预测值的显著改善,表明机器学习模型降低了假阳性率,这对HCC监测项目中的临床决策和资源分配至关重要。
SHAP交互分析揭示的协同效应反映了HCC发生发展过程中多系统、多层次病理生理变化的内在相互联系。LSM与PLT之间的显著交互作用具有深刻的病理生理学基础:当LSM达到30 kPa阈值时,临床上显著的门静脉高压发生,此时血小板破坏效应显著放大;更重要的是,当PLT降至临界水平时,血小板源性生长因子和转化生长因子-β等细胞因子水平下降,这些因子原本在维持肝脏微环境稳态和抑制异常血管生成中发挥作用。因此,高LSM背景下的血小板减少不仅反映了门静脉高压的严重程度,也表明肝脏微环境调节机制的失效,为肿瘤血管生成和侵袭性生长创造了有利条件。
基于阈值优化分析结果,研究提出了风险分层的HCC监测方案:RF模型预测概率≥0.15的患者应归类为高风险,需要每3-6个月进行增强MRI或CT强化监测;预测概率<0.15的患者可安全继续每6-12个月的标准超声监测。这种策略可在保持最佳癌症检测率的同时优化资源分配,将强化监测导向最可能受益的患者,减少低风险个体的不必要检测。
研究的局限性包括单中心回顾性设计可能存在的选择偏倚、相对较短的随访时间(中位35个月)、中国患者人群的适用性限制以及类别不平衡(9.8%HCC发生率)可能对模型性能特别是敏感性的影响。未来研究可开展大规模多中心前瞻性验证研究,探索将可解释性分析整合到模型开发流程中的方法,同时纳入更多生物标志物和基因组数据构建更全面的预测模型。
总之,这项研究为HBV相关cACLD患者的HCC风险预测提供了有效的机器学习工具,通过可解释的人工智能方法揭示了关键预测因子及其交互作用机制,为临床实践中的个性化风险分层和精准监测策略制定了实用框架,有望改善患者预后并优化医疗资源配置。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号