基于生物年龄与衰弱预测的可解释机器学习框架:衰老生物标志物的探索之旅

【字体: 时间:2025年04月23日 来源:Scientific Reports 3.8

编辑推荐:

  随着老龄化社会的加剧,理解衰老过程、预防与衰老相关疾病至关重要。研究人员开展 “结合生物年龄(BA)和衰弱预测的可解释机器学习框架用于生物标志物发现” 的研究。结果表明,胱抑素 C(CysC)在 BA 和衰弱预测中均重要。该研究有助于揭示衰老机制,助力健康老龄化。

  在人口老龄化的浪潮下,衰老相关的研究成为科学界关注的焦点。生物年龄(Biological Age,BA)和衰弱作为衡量人体衰老程度的重要指标,蕴含着衰老进程的关键信息。然而,当前对于二者的研究存在诸多不足。一方面,虽然已有不少机器学习(Machine Learning,ML)模型分别用于预测 BA 和衰弱,但缺乏将二者结合并利用可解释人工智能(eXplainable Artificial Intelligence,XAI)技术深入分析生物标志物的研究。另一方面,许多 ML 模型的 “黑箱” 特性使得其预测结果难以解释,尤其在医疗健康领域,理解预测背后的原因对临床决策至关重要 。为了填补这些研究空白,来自上海交通大学的研究人员开展了一项极具意义的研究。
研究人员利用中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)数据库中的数据,构建了一个综合分析框架。该框架结合 BA 和衰弱预测的 ML 模型,运用 XAI 中的 SHapley Additive exPlanations(SHAP)分析方法,旨在识别与衰老相关的血液生物标志物,并量化它们在预测模型中的相对贡献。

在研究过程中,研究人员使用了多种关键技术方法。首先,数据来源上,选取了 CHARLS 数据库 2011 - 2012 年基线调查数据作为训练集(n = 9702),2015 - 2016 年数据作为测试集(n = 9455)。其次,采用 4 种基于树的 ML 算法(随机森林 Random Forest,RF;梯度提升 Gradient Boosting,GB;CatBoost;极端梯度提升 eXtreme Gradient Boosting,XGBoost)进行模型训练和验证。对于数据处理,缺失值用均值插补,数据通过 min - max 标准化处理。为评估模型性能,BA 预测模型采用 R2 和平均绝对误差(Mean Absolute Error,MAE),衰弱状态预测模型则使用受试者工作特征曲线(Receiver Operating Characteristic curve,ROC)和曲线下面积(Area Under the Curve,AUC)。最后,运用 SHAP 技术解释模型并分析生物标志物的重要性。

在研究结果部分,首先是评估指标与特征重要性分析。在 BA 预测模型中,CatBoost 表现最佳,其 MAE 为 6.313,R2 达到 0.269 。在衰弱状态预测模型里,Gradient Boosting 表现最优,其 AUC 达到 0.95。其次,生物标志物的比较与解读方面,传统特征重要性分析显示,BA 预测中胱抑素 C(Cystatin C,CysC)最重要,衰弱预测中糖化血红蛋白(Glycated Hemoglobin,HbA1c)最重要。但 SHAP 分析表明,CysC 在 BA 和衰弱预测模型中均为最重要的生物标志物。此外,研究还发现一些生物标志物之间存在正负相关关系,如肌酐(Creatinine,Cr)与 CysC 在衰弱预测模型中方向相反,这可能为探索新的衰老相关联合指标提供线索。

在讨论部分,该研究提出的框架具有创新性,通过跨模型研究,有助于理解 BA、衰弱与生物标志物之间的关联,为开发针对性干预措施、促进健康老龄化提供了理论依据。从生物标志物角度来看,CysC 不仅与肾功能和炎症密切相关,在衰老过程中扮演关键角色,而且其水平监测对评估个体健康、预防衰老相关疾病具有重要临床意义。而 HbA1c 虽在传统特征重要性中对衰弱预测重要,但在 SHAP 分析中排名靠后,这凸显了不同分析方法的差异,也表明 SHAP 分析在更准确解释模型和生物标志物重要性方面的优势。

总体而言,这项研究构建的结合 BA 和衰弱预测的 ML 与 XAI 技术的框架,为衰老相关生物标志物的研究提供了新的思路和方法。通过挖掘关键生物标志物,有助于深入理解衰老机制,为未来预防和治疗衰老相关疾病奠定基础,对推动健康老龄化研究具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号