糖尿病合并肥胖风险预测模型的构建与验证:基于NHANES数据的机器学习分析

【字体: 时间:2025年08月23日 来源:Frontiers in Public Health 3.4

编辑推荐:

  这篇研究利用NHANES 2007–2018数据,通过LASSO回归和9种机器学习算法(如Logistic回归、随机森林RF等),构建了T2DM患者肥胖风险的预测模型。研究揭示了年龄、抑郁、ALP等19个关键变量与肥胖的关联,最终Logistic模型表现最优(AUC=0.781),并开发了可视化列线图,为糖尿病合并肥胖的早期干预提供了量化工具。

  

背景

糖尿病(DM)已成为全球最普遍的慢性代谢性疾病之一,国际糖尿病联盟(IDF)数据显示,2021年全球糖尿病患者达5.37亿,预计2045年将增至7.83亿。肥胖作为糖尿病常见并发症,显著增加心血管风险和代谢负担,但其在糖尿病人群中的风险因素尚未完全阐明。国家健康与营养调查(NHANES)提供了大规模临床数据,结合机器学习(ML)技术,为肥胖风险预测提供了新思路。

方法

研究纳入NHANES 2007–2018周期中3,794名T2DM患者,按BMI≥30 kg/m2分为肥胖组(57.0%)与非肥胖组。采用LASSO回归(10折交叉验证)筛选19个关键变量,包括人口统计学(年龄、性别)、生化指标(ALP、Scr)、生活方式(总脂肪摄入)等。随后构建9种ML模型(如Logistic回归、XGBoost等),通过ROC曲线(AUC)、校准曲线、Brier评分和决策曲线分析(DCA)评估性能。最优模型进一步转化为临床适用的列线图。

结果

肥胖组患者更年轻(57.85±12.58岁),女性比例更高,且抑郁、高血压患病率显著升高(p<0.05)。生化指标中,ALP、UA、TG等差异显著(p<0.05),而维生素摄入无统计学意义。LASSO筛选的变量中,抑郁和高血压(EH)是肥胖最强正向预测因子,男性与年龄则呈负相关。Logistic模型表现最佳(训练集AUC=0.751,测试集AUC=0.781),Brier评分最低(0.189),且DCA显示其临床净收益最高。列线图以131分为临界值,可直观计算个体肥胖概率。

讨论

研究创新性在于聚焦糖尿病人群的肥胖特异性预测,并整合心理(抑郁)、代谢(ALP、UA)等多维度指标。抑郁通过下丘脑-垂体-肾上腺轴(HPA轴)异常影响能量代谢,而ALP、AST等肝酶提示内脏脂肪积累可能早于代谢失衡表现。值得注意的是,传统因素如吸烟、睡眠未进入模型,可能与变量共线性或NHANES自报数据偏差有关。LASSO的变量筛选能力优于传统回归,但研究存在横断面设计局限,且缺乏外部验证。

结论

该研究通过机器学习揭示了T2DM患者肥胖的多因素交互机制,开发的Logistic列线图兼具准确性与临床实用性,为早期识别高风险患者提供了量化工具。未来需前瞻性研究验证模型在真实世界的适用性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号