基于数据的聚类分析在血液透析患者中识别出了三种临床表型

《Renal Failure》:Data-driven cluster analysis identifies three clinical phenotypes in hemodialysis patients

【字体: 时间:2025年11月22日 来源:Renal Failure 3

编辑推荐:

  本研究采用机器学习分析1207例维持性血透患者22项临床指标,构建双层表型分类框架,识别出高滞留炎症型、最优清除型和中间稳定型三种表型,通过复合指标(如中-小分子清除指数和铁蛋白-血红蛋白比率)实现精准分类,为临床个体化治疗提供依据。

  在现代医学领域,随着对疾病复杂性的深入理解,传统的单参数管理方式已显现出局限性。特别是在慢性肾病终末期(ESRD)患者中,个体间的临床差异显著,这为精准医学的应用提供了重要的契机。本文探讨了一种创新的两层患者表型分类框架,通过机器学习技术对1207名维持性血液透析患者进行分析,构建了五个具有机制依据的综合指标,其中包括β?-微球蛋白清除率与Kt/V的结合指标(β?-微球蛋白减少率×Kt/V)和铁蛋白-血红蛋白比值。这些综合指标在区分不同临床表型方面表现出优于传统方法的潜力,从而为实现个性化治疗奠定了基础。

研究团队采用了K-means聚类算法对22项临床指标进行无监督分析,随后利用六个广泛可用的生物标志物进行监督分类。通过这一过程,研究人员识别出三种不同的代谢表型:高保留-炎症型(19.5%)、最佳清除型(24.3%)和中间稳定型(56.0%)。这些表型不仅具有良好的稳定性(调整后兰德指数为0.9181),还反映了患者在炎症、营养、贫血、矿物质代谢、透析效率和电解质变化等方面的独特特征。例如,高保留-炎症型患者表现出明显的透析不足和功能性铁缺乏,而最佳清除型患者则具有较高的透析效率和较低的炎症指标。中间稳定型患者则在各项指标上保持平衡,构成了透析患者群体的主体。

为了确保研究的临床实用性,研究者进一步开发了一个简化模型,仅依赖于六个临床指标进行分类。该模型在多个监督学习算法中表现出良好的性能,如随机森林(AUC=0.919,准确率=88.4%)、XGBoost(AUC=0.908,准确率=88.2%)和支持向量机(AUC=0.893,准确率=89.0%)。这些算法的性能指标均达到临床可接受的水平,同时确保了与综合分析结果的一致性。此外,研究团队还设计了一种透明的评分系统——血透表型临床评分(HPCS),以便为临床决策提供可计算的阈值。

研究中还进行了严格的内部验证,通过500次自举抽样重新计算聚类结果,并评估各类指标的一致性。结果显示,该分类系统的稳定性较高(平均兰德指数0.8871;平均调整兰德指数0.7672),进一步验证了其在临床应用中的可靠性。此外,通过10折交叉验证,该模型的调整兰德指数达到了0.9181,表明其在不同数据子集中的表现具有良好的一致性。

在临床特征分析方面,研究团队利用单因素方差分析(ANOVA)和Kruskal-Wallis检验,对不同表型的临床指标进行了比较。结果显示,各表型在多个关键指标上存在显著差异,如铁蛋白-血红蛋白比值、β?-微球蛋白清除率和Kt/V值等。这些差异反映了不同表型在病理生理机制上的区别,也为个体化治疗提供了依据。例如,高保留-炎症型患者可能需要更频繁的透析治疗和针对炎症的干预措施,而最佳清除型患者则可以维持当前的透析参数,同时关注铁过载的风险。

为了进一步增强模型的临床适用性,研究团队还进行了时间稳定性评估。通过分析349名具有3个月随访数据的患者,发现表型在不同时间点之间具有较高的稳定性(Cohen’s κ=0.686,p<0.001),其中79.1%的患者保持其初始分类。这表明该分类系统不仅能够准确识别当前的代谢状态,还具备一定的预测能力,有助于提前发现潜在的代谢变化。

此外,研究还探讨了治疗因素对表型的影响。通过对987名患者的透析处方数据进行分析,研究者发现透析参数(如血流量、透析液流量、治疗时间和超滤量)在不同表型之间没有显著差异。这意味着表型的形成主要受到生物学因素的影响,而非治疗方案。通过多变量线性回归分析,研究进一步量化了治疗参数对关键生物标志物的解释能力,结果显示治疗参数仅能解释少量的生物标志物变异,表明表型具有较强的独立性。

该研究的临床应用价值在于其能够为血液透析患者提供基于生物标志物的个体化治疗方案。通过识别不同的代谢表型,医生可以更有针对性地调整治疗策略,从而提高治疗效果和资源利用效率。例如,对于高保留-炎症型患者,可以考虑增加透析频率或延长透析时间,以改善清除率;而对于最佳清除型患者,则需保持当前治疗方案,并关注铁过载的潜在风险;而中间稳定型患者则应定期监测,以便在病情变化前采取干预措施。

在方法学上,该研究构建了一种两层表型识别框架,将无监督聚类与监督分类相结合。这种框架不仅能够捕捉复杂的生物标志物交互作用,还能够适应不同的临床环境和数据条件。研究中使用的复合指标,如β?-微球蛋白清除率与Kt/V的结合指标,具有坚实的生理学基础,能够更全面地评估透析效率,特别是针对心血管毒性物质的清除能力。这些指标的开发为精准医学提供了新的工具,使治疗决策更加科学和系统。

该研究还指出了未来研究的方向,包括多中心研究以验证表型与临床结局之间的关系,以及开发自动化系统以实现电子病历(EMR)中的表型识别和治疗推荐。此外,研究建议通过多组随机对照试验,进一步验证表型指导治疗的有效性。这些措施将有助于将精准医学的理念从研究阶段转化为临床实践,从而改善血液透析患者的治疗效果和生活质量。

尽管该研究在方法学和临床应用方面取得了显著进展,但也存在一些局限性。首先,由于研究设计为横断面研究,无法全面评估表型的长期变化及其与临床结局之间的因果关系。其次,研究样本来自中国上海的一家三级医院,可能受到地域因素的影响,限制了结果的普遍适用性。因此,未来需要在更多样化的医疗环境中进行验证,以确保表型识别框架的广泛适用性。

总体而言,该研究为血液透析患者的精准医学管理提供了新的思路和方法。通过构建基于生物标志物的分类框架,研究不仅揭示了患者之间的临床异质性,还为个体化治疗策略的制定提供了科学依据。未来的研究应进一步探索表型与具体临床结局之间的关系,并推动相关技术在临床中的广泛应用,以实现更高效的透析管理和更好的患者预后。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号