基于可解释机器学习的HIV/TB共感染临床结局预测:LightGBM模型识别关键风险因素

《BMC Infectious Diseases》:Explainable machine learning for predicting clinical outcomes in HIV/TB co-infection: a comparative retrospective study

【字体: 时间:2025年11月16日 来源:BMC Infectious Diseases 3

编辑推荐:

  本研究针对HIV/TB共感染患者治疗结局预测的临床难题,研究人员开展了一项基于可解释机器学习(ML)的回顾性研究。通过比较六种ML模型,发现LightGBM模型在预测不良结局方面表现最佳(AUC=0.771),并通过SHAP分析揭示了年龄、CD4+和CD8+T细胞计数、BMI及职业等关键预测因子。该研究为早期识别高风险患者、实现精准干预提供了可靠工具。

  
在全球公共卫生领域,HIV与结核病(TB)的共感染一直是一个严峻的挑战。这两种病原体在人体内相互影响,导致患者的治疗失败率和死亡率远高于单纯感染结核病。根据世界卫生组织(WHO)的数据,结核病是艾滋病病毒感染者(PLHIV)中最主要的机遇性感染,也是导致其死亡的重要原因。尽管全球结核病防控工作取得了一定进展,但在HIV高流行地区,共感染问题依然突出。在中国,广西壮族自治区作为HIV高发区,也面临着HIV/TB共感染的沉重负担。
传统的临床预测模型往往难以整合和处理高维度的临床、免疫学及社会人口学数据,且在面对患者异质性时适应性较差。近年来,机器学习(ML)技术凭借其强大的数据整合与模式识别能力,在复杂疾病的预后预测中展现出巨大潜力。然而,许多机器学习模型被视为“黑箱”,其决策过程不透明,这严重阻碍了临床医生对模型的信任和采纳。因此,开发兼具高预测性能和高可解释性的模型,对于将人工智能工具真正融入临床决策流程至关重要。
为了应对这一挑战,Sun et al. 在《BMC Infectious Diseases》上发表了一项研究,旨在开发并比较多种机器学习模型,以预测HIV/TB共感染患者的临床结局。该研究不仅关注模型的预测准确性,还利用可解释人工智能(XAI)技术深入剖析了影响患者预后的关键因素,为临床实践提供了宝贵的洞见。
主要技术方法
本研究是一项单中心回顾性研究,纳入了359名HIV/TB共感染患者。研究人员从电子病历中提取了人口统计学、临床特征及免疫学指标等数据。为处理数据中的类别不平衡问题,研究采用了合成少数类过采样技术(SMOTE)对训练集进行平衡。随后,研究团队训练并比较了六种机器学习分类器(Random Forest, XGBoost, LightGBM, SVM, Extra Trees, CatBoost)的性能。模型性能通过受试者工作特征曲线下面积(AUC)、准确率、召回率、精确率、特异性和F1分数等指标进行评估。为了综合评估模型性能,研究采用了多准则决策方法(TOPSIS)对模型进行排名。最后,研究利用SHAP(SHapley Additive exPlanations)方法对表现最佳的模型进行解释,以揭示关键预测因子及其对模型输出的影响方向。
研究结果
患者特征与结局
研究共纳入359名患者,其中304名(84.7%)获得了良好结局,55名(15.3%)结局不良。基线特征分析显示,职业类型(p=0.026)以及关键免疫学指标CD4+T细胞计数(p=0.002)和CD8+T细胞计数(p=0.005)在结局良好组和不良组之间存在显著差异。而性别、患者类型(初治或复治)及吸烟状况等因素在两组间无显著差异。
模型性能比较
在六种机器学习模型中,LightGBM模型展现了最佳的综合性能。其AUC为0.771,准确率为84.72%,F1分数为0.522。虽然Random Forest模型获得了最高的准确率(86.11%)和特异性(93.65%),但其召回率(33.33%)较低,意味着它漏诊了大部分结局不良的患者。相比之下,LightGBM在召回率(66.67%)和特异性(87.30%)之间取得了更好的平衡。通过TOPSIS多准则排名,LightGBM同样位列第一,证实了其在多个性能指标上的综合优势。
特征重要性与模型解释
SHAP分析揭示了LightGBM模型进行预测的关键驱动因素。全局特征重要性排名显示,年龄、CD8+T细胞计数、职业、身体质量指数(BMI)和CD4+T细胞计数是影响模型预测最重要的五个特征。具体而言,年龄增长、BMI降低以及免疫抑制程度加重(表现为CD4+T细胞计数降低和CD4/CD8比值倒置)会显著增加模型预测不良结局的风险。而较高的BMI、较强的免疫标志物以及就业状态则与良好的预后预测相关。SHAP摘要图进一步展示了这些特征对个体患者预测的具体影响方向。例如,年龄较大的患者(图中红点)通常具有较高的SHAP值,表明其风险增加;而BMI较低的患者(蓝点)同样贡献了更高的风险。CD8+T细胞计数呈现出复杂的模式,极高和极低的水平都可能增加风险,这可能反映了HIV/TB共感染中免疫激活和免疫耗竭的双重效应。此外,职业作为社会经济状况的指标,也显示出显著的影响,失业或低社会地位的患者往往被预测为高风险。
研究结论与讨论
本研究成功开发并验证了一个基于LightGBM算法的预测模型,用于识别HIV/TB共感染患者的不良治疗结局。该模型不仅表现出稳健的预测性能(AUC=0.771),更重要的是,通过SHAP解释框架,研究揭示了驱动模型决策的关键临床因素,使模型从“黑箱”转变为“白箱”。
研究结果与现有临床证据高度一致。年龄、免疫抑制状态(CD4+T细胞计数和CD4/CD8比值)以及营养状况(BMI)被证实是影响预后的核心生物学因素。同时,职业(作为社会经济状况的代理指标)的显著影响,也强调了在HIV/TB共感染管理中,社会决定因素与生物学因素同等重要。
SHAP分析提供的不仅仅是全局特征重要性,还包括个体化的解释。通过SHAP力图,临床医生可以直观地看到,对于一个特定的高风险患者,是哪些因素(如极低的CD4+T细胞计数、营养不良、合并症等)共同作用,将其推向了不良结局的预测。这种个体化的解释极大地增强了模型在临床实践中的可用性,有助于医生理解模型逻辑,并针对特定风险因素制定精准的干预措施。
尽管研究结果令人鼓舞,但作者也指出了其局限性。作为一项单中心回顾性研究,其结果的普适性有待在更大规模、多中心的前瞻性队列中进行外部验证。此外,研究未纳入结核分枝杆菌耐药性数据和详细的抗病毒治疗依从性数据,这些因素可能对结局产生重要影响。未来,将此类模型整合到电子病历系统中,实现实时风险预警,并开展前瞻性研究以评估其对临床结局的实际改善效果,将是下一步工作的重点。
总之,这项研究证明了将可解释机器学习应用于HIV/TB共感染管理的可行性。通过结合强大的预测能力和透明的决策解释,该模型为临床医生提供了识别高风险患者、优化资源分配和改善治疗结局的有力工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号