伊朗东南部结核病患者生存因素分析:Cox回归、生存树与随机生存森林模型的比较研究
《BMC Public Health》:Factors associated with survival of tuberculosis patients in Southeast Iran: comparison of stepwise cox regression, survival tree, and random survival forest
【字体:
大
中
小
】
时间:2025年10月18日
来源:BMC Public Health 3.6
编辑推荐:
本研究针对伊朗东南部高发区结核病(TB)患者生存影响因素不明的问题,采用历史队列数据(2016-2021年,n=3429),通过Stepwise Cox回归、生存树和随机生存森林(RSF)模型进行对比分析。研究发现治疗2个月后痰涂片阳性(HR=15.44)和3个月后阳性(HR=38.28)是死亡最强预测因子,而肺外结核(HR=0.16)和高体重(HR=0.98)具有保护作用。RSF模型进一步验证痰涂片结果和年龄为核心变量,为高风险人群早期干预提供精准依据。
在全球结核病防治形势依然严峻的背景下,伊朗东南部地区因其特殊的地理位置和社会经济条件成为结核病高发区域。尽管结核病本身是可防可治的疾病,但根据世界卫生组织最新报告,结核病在2023年重新成为单一传染病中的头号杀手,每年仍有超过1000万新发病例。特别是在伊朗的锡斯坦-俾路支斯坦省,结核病发病率高达全国平均水平的8倍以上,这种区域性差异凸显了开展针对性研究的迫切性。
以往研究已经发现年龄、体重、结核类型等因素与结核病患者生存率相关,但不同地区的影响因素可能存在差异。伊朗东南部地区医疗资源相对匮乏,患者群体特征复杂(包括当地居民、囚犯和跨境移民),传统统计方法可能无法充分捕捉因素间的复杂交互关系。为此,Sharafi等研究人员在《BMC Public Health》发表了题为《Factors associated with survival of tuberculosis patients in Southeast Iran: comparison of stepwise cox regression, survival tree, and random survival forest》的研究论文,首次在该地区同时应用三种生存分析模型进行对比研究,旨在更全面地揭示影响结核病患者生存的关键因素。
研究方法上,团队采用历史队列研究设计,纳入伊朗沙赫尔地区2016-2021年3429例结核病患者的临床监测数据。主要运用三种核心分析技术:Stepwise Cox比例风险回归模型用于筛选显著变量并计算风险比(HR);生存树算法通过递归分割构建决策树模型;随机生存森林(RSF)则通过Bootstrap重采样构建多棵生存树进行集成预测。模型性能通过C-index(一致性指数)进行评估,以0.5为随机预测基准,越接近1表明预测准确性越高。
研究共纳入3429例结核病患者,其中292例(8.5%)死亡。死亡组平均年龄(53.87±22.83岁)显著高于存活组(43.79±22.25岁),体重(43.4±12.5 kg vs 46.7±21.4 kg)显著较低。单因素分析显示性别、治疗分组、结核类型、痰涂片结果等变量在两组间分布存在显著差异(P<0.05)。Kaplan-Meier生存曲线直观展示了整体人群的生存概率随时间变化趋势。
生存树模型识别出治疗2个月后痰涂片结果为首要分割变量。后续节点显示,肺结核类型联合3个月后痰涂片阴性对生存率产生重要影响。生存率最高的患者群体特征为:治疗2个月后痰涂片阴性、无胸痛症状且治疗前痰涂片阴性。相反,生存率最低的患者表现为:治疗2个月后痰涂片阳性、肺结核类型、治疗3个月后痰涂片阳性且年龄超过65岁。
Stepwise Cox回归显示,治疗2个月后痰涂片阳性患者的死亡风险是阴性患者的15.44倍(95%CI: 11.37-20.97),3个月后阳性者的风险进一步升高至38.28倍(95%CI: 9.48-154.67)。囚犯身份(HR=3.85)、胸痛症状(HR=1.35)和年龄增长(每岁HR=1.015)显著增加死亡风险。相反,肺外结核(HR=0.169)、阿富汗或巴基斯坦国籍(HR=0.36)和体重增加(每公斤HR=0.98)为保护因素。所有变量均满足比例风险假设(P>0.05)。
RSF模型确认治疗2个月后痰涂片为最重要预测变量,其次为年龄、3个月后痰涂片结果、体重和结核类型。变量重要性排序显示国籍、城市化程度、新发/复发情况等因素影响力相对较弱。
Stepwise Cox模型的C-index值高于RSF模型,表明在该数据集上前者具有更好的预测性能。但两种模型均显著优于随机预测水平(C-index>0.5),且一致识别出治疗2个月后痰涂片结果和年龄为最关键预测因子。
本研究通过多模型验证揭示了伊朗东南部结核病患者生存的独立预测因素。治疗早期(2-3个月)痰涂片持续阳性作为最强风险预测因子,可能与耐药性发展或免疫功能受损相关,这与Moosazadeh等先前研究结论一致。年龄与生存率的负相关关系反映了老年患者因合并症、免疫衰老等因素导致的脆弱性,提示需要针对老年群体制定强化监测方案。
体重作为保护因素的重要发现,支持了营养状态在结核病预后中的关键作用。体重减轻可能通过削弱免疫功能加剧疾病进展,这与Gupta等关于营养不良与结核病死亡率关联的研究相互印证。肺外结核患者较好的生存结局可能与其较低的传播风险和不同的病理机制有关。
值得注意的是,伊朗患者相比阿富汗/巴基斯坦移民表现出更高的死亡风险,这与通常预期的移民健康劣势相反。研究者提出"健康移民效应"可能解释这一现象——跨境务工者多为年轻健康群体,而重症患者可能选择回国治疗。此外,不排除遗传因素或医疗可及性差异的影响,这需要后续研究进一步验证。
模型方法学上,Cox回归虽然显示更高C-index值,但RSF模型能够捕捉变量间的复杂非线性关系,两者形成互补。生存树模型提供的直观决策路径尤其适合临床实践中的快速风险评估。
研究局限性包括缺乏HIV状态和耐药性数据,以及右删失数据可能带来的偏倚。尽管如此,该研究仍为伊朗东南部结核病防控提供了重要实证依据,强调了对痰涂片持续阳性、老年、低体重、囚犯等高危群体的早期识别和干预必要性。卫生政策制定者可依据这些风险分层指标,优化资源配置,最终改善结核病患者的生存结局。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号