
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于韩国老年人全国代表性数据集,利用生物电阻抗分析及握力数据,构建并评估用于预测肌少症的CatBoost机器学习模型
《BMC Geriatrics》:Construction and evaluation of a CatBoost-based machine learning model for sarcopenia prediction using bioelectrical impedance analysis (BIA) and handgrip strength (HGS) from a nationally representative dataset of Korean older adults
【字体: 大 中 小 】 时间:2026年07月03日 来源:BMC Geriatrics 4.5
编辑推荐:
摘要本研究旨在利用具有全国代表性的数据,开发并验证一种可解释的机器学习模型,用于预测老年人的肌少症。我们采用了2022–2023年的韩国国家健康与营养调查数据(KNHANES;样本量n=2,721,年龄≥65岁),构建了一个整合了人口统计、人体测量、生化指标以及生物电阻抗分析数据
本研究旨在利用具有全国代表性的数据,开发并验证一种可解释的机器学习模型,用于预测老年人的肌少症。我们采用了2022–2023年的韩国国家健康与营养调查数据(KNHANES;样本量n=2,721,年龄≥65岁),构建了一个整合了人口统计、人体测量、生化指标以及生物电阻抗分析数据的驱动型框架。肌少症的诊断依据是2019年亚洲肌少症工作组制定的标准,即四肢骨骼肌质量较低且握力减弱。研究共使用了五种监督学习算法——逻辑回归、随机森林、XGBoost、LightGBM和CatBoost,并通过十折交叉验证进行训练,同时建立了针对不同性别的模型以考虑生物学差异。经过优化的CatBoost模型表现出最高的性能且各项指标最为均衡:在男性中,准确率为0.912,灵敏度为0.833,特异性为0.920,F1值为0.645,AUC值为0.930;在女性中,准确率为0.895,灵敏度为0.567,特异性为0.932,F1值为0.523,AUC值为0.928。基于特征重要性总增益的分析显示,由生物电阻抗分析得出的水分指标——细胞内水、细胞外水及总体水含量——以及四肢瘦软组织质量,分别占男性模型总重要性的72.4%,女性模型的70.8%。SHapley加性解释方法指出,细胞内水和相位角是最重要的预测因子。在男性中,细胞内水的平均绝对SHAP值为0.660,相位角的值为0.282;而在女性中,这两项指标的对应值分别为0.750和0.536,进一步证实了它们对模型输出的重要贡献。总之,这款基于CatBoost且可通过SHAP方法进行解释的模型,有效地将生物电阻抗分析得到的生理参数与临床数据相结合,能够实现精准且分性别的肌少症预测,有助于大规模的早期筛查。
本研究旨在利用具有全国代表性的数据,开发并验证一种可解释的机器学习模型,用于预测老年人的肌少症。我们采用了2022–2023年的韩国国家健康与营养调查数据(KNHANES;样本量n=2,721,年龄≥65岁),构建了一个整合了人口统计、人体测量、生化指标以及生物电阻抗分析数据的驱动型框架。肌少症的诊断依据是2019年亚洲肌少症工作组制定的标准,即四肢骨骼肌质量较低且握力减弱。研究共使用了五种监督学习算法——逻辑回归、随机森林、XGBoost、LightGBM和CatBoost,并通过十折交叉验证进行训练,同时建立了针对不同性别的模型以考虑生物学差异。经过优化的CatBoost模型表现出最高的性能且各项指标最为均衡:在男性中,准确率为0.912,灵敏度为0.833,特异性为0.920,F1值为0.645,AUC值为0.930;在女性中,准确率为0.895,灵敏度为0.567,特异性为0.932,F1值为0.523,AUC值为0.928。基于特征重要性总增益的分析显示,由生物电阻抗分析得出的水分指标——细胞内水、细胞外水及总体水含量——以及四肢瘦软组织质量,分别占男性模型总重要性的72.4%,女性模型的70.8%。SHapley加性解释方法指出,细胞内水和相位角是最重要的预测因子。在男性中,细胞内水的平均绝对SHAP值为0.660,相位角的值为0.282;而在女性中,这两项指标的对应值分别为0.750和0.536,进一步证实了它们对模型输出的重要贡献。总之,这款基于CatBoost且可通过SHAP方法进行解释的模型,有效地将生物电阻抗分析得到的生理参数与临床数据相结合,能够实现精准且分性别的肌少症预测,有助于大规模的早期筛查。