基于随机生存森林的中国HIV/AIDS患者高效抗逆转录病毒治疗后生存预测模型的开发与空间外部验证

【字体: 时间:2025年08月19日 来源:Journal of Medical Internet Research 6

编辑推荐:

  推荐:本研究针对HIV/AIDS患者生存预测的临床需求,通过机器学习算法构建随机生存森林(RSF)模型,筛选出血红蛋白、CD4+ T细胞等7个关键预测因子,在南京-南通队列中验证显示C指数达0.896/0.756,较传统Cox模型显著提升预测精度,为个体化治疗决策提供量化工具。

  

在全球艾滋病防治取得显著进展的背景下,HIV感染者通过高效抗逆转录病毒治疗(HAART)已能获得接近常人的预期寿命。然而,免疫系统受损导致的继发感染和肿瘤风险仍如达摩克利斯之剑高悬——据统计全球累计死亡病例达4230万,中国患者面临人口老龄化与治疗方案个性化不足的双重挑战。传统预后模型依赖线性假设的Cox回归,难以处理临床指标间的复杂交互,更缺乏跨区域验证的"实战"检验。

无锡市人民医院肺移植中心的研究团队开展了一项突破性研究,通过中国疾病预防控制中心艾滋病性病预防控制中心的全国监测系统,纳入南京-南通两地8960例患者数据,首次将随机生存森林(RSF)算法应用于HIV生存预测。这项发表在《Journal of Medical Internet Research》的研究,构建了包含血红蛋白、基线CD4+等7个核心指标的预测模型,其创新性在于采用双重随机化策略处理临床数据的非线性关系,并通过空间外部验证证实模型的普适性。

研究采用三大关键技术:基于国家监测系统的多中心队列构建(南京5261例训练集/南通3699例验证集)、随机生存森林算法的变量重要性(VIMP)筛选、以及集成Brier评分(iBS)和决策曲线分析(DCA)的多维度评估体系。通过1000次Bootstrap内部验证和独立外部验证,确保模型稳健性。

【模型开发】

通过100次自举采样确定血红蛋白(204.6 g/L)和基线CD4+(314 cells/μL)为最关键预测因子,构建的RSF模型变量重要性显著高于传统临床指标如病毒载量(P<0.001)。

【模型验证】

内部验证显示RSF的整合AUC(iAUC)达0.917,远超Cox模型的0.871;在外部验证中仍保持0.750的预测精度。时间依赖性AUC(tdAUC)在5年随访时达0.773,较Cox模型提高2.7个百分点。

【临床转化】

开发的网页工具可实现个体化风险预测,将患者分为3个风险层级:高风险组死亡风险是低风险组的44.41倍(95%CI 38.2-51.6),其5年生存率仅76.3% vs 低风险组98.1%。

这项研究开创性地解决了三大临床痛点:首次证明机器学习模型在中国HIV人群中的跨区域适用性;突破性地识别教育水平等非传统预测因子;通过风险分层为资源分配提供量化依据。特别值得注意的是,模型在≥60岁老年群体中表现优异(AUC 0.812),为这个快速增长但常被忽视的群体提供了精准管理工具。

研究也存在一定局限:阳性预测值较低(约62%)提示需结合临床判断;未纳入18岁以下患者数据。未来可通过整合多组学数据和实时监测指标进一步提升模型性能。该成果标志着我国艾滋病精准医疗迈出关键一步,其方法论对其他慢性病预后研究也具有重要借鉴意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号