
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于AI与空腹血糖的胰岛素抵抗无创预测模型开发及多标准验证
【字体: 大 中 小 】 时间:2025年08月19日 来源:Diabetology & Metabolic Syndrome 3.9
编辑推荐:
本研究针对胰岛素抵抗(IR)早期筛查需多次侵入性检测的临床痛点,开发了仅需空腹血糖(Fasting Plasma Glucose)结合体测指标的AI预测系统。清华大学深圳国际研究生院团队利用NHANES和CHARLS队列数据,构建了基于CatBoost和TabKANet算法的多标准评估模型,在METS-IR指标预测中取得AUC 0.9731(内部)和0.9591(外部)的优异表现,为糖尿病前期人群提供了一种便捷的家庭自测方案。
在糖尿病成为全球公共卫生重大挑战的背景下,胰岛素抵抗(IR)作为糖尿病和心血管疾病的关键前兆,其早期筛查却受制于传统检测方法的复杂性——金标准高胰岛素-正葡萄糖钳夹技术操作繁琐,而常用替代指标HOMA-IR、TyG指数等仍需多项血液检测。这种技术壁垒使得普通人群难以进行常规监测,导致错过最佳干预窗口。
清华大学深圳国际研究生院与深圳湾实验室生物医学工程技术研究所的联合团队,在《Diabetology》发表的研究中开创性地提出"单指标侵入"解决方案。研究人员利用美国NHANES(1999-2020)和中国CHARLS(2015)两大队列共32,341名非糖尿病人群数据,开发了仅需空腹血糖结合体测参数的AI预测系统。通过对比Logistic Regression、XGBoost、CatBoost和新型神经网络TabKANet等算法,在HOMA-IR(阈值2.5)、TyG指数(阈值8.85)和METS-IR(阈值41.33)三种评估标准下建立分类模型,并首次实现METS-IR数值的连续预测。
关键技术方法包括:1) 采用NHANES队列22,008例数据(6:2:2划分训练/验证/测试集);2) 输入特征仅包含年龄、性别、BMI等9项可居家测量指标+空腹血糖;3) 通过SHAP值解析特征贡献度;4) 用CHARLS队列10,333例数据进行跨国家、跨队列验证。
比较HOMA-IR分类性能
CatBoost算法表现最佳,测试集AUC达0.8596,与神经网络TabKANet(0.8591)相当。所有模型AUC均超过0.85,证实基础特征组合对HOMA-IR评估的有效性。
TyG指数分类验证
在外部验证中,CatBoost保持稳定性能(AUC 0.7442 vs 内部0.7777)。值得注意的是,尽管CHARLS人群平均BMI(23.78 vs NHANES的28.41)和空腹血糖(93.97 vs 100.68 mg/dL)存在显著差异,模型仍展现良好泛化能力。
METS-IR突破性表现
该指标预测展现出惊人精度:TabKANet在数值预测中R2达0.916(内部)和0.8183(外部),RMSE分别为3.2643和3.057。分类任务中CatBoost实现AUC 0.9731,且跨种族亚组分析显示AUC稳定在0.96-0.97区间。
特征重要性解析
通过SHAP分析发现,除预期强相关的BMI和空腹血糖外,腰围(Waist Circumference)呈现显著非线性效应:当>95cm时对IR判断贡献陡增,这与内脏脂肪堆积的病理机制高度吻合。简化模型测试显示,仅用"腰围+空腹血糖"组合仍能维持AUC>0.91的优异性能。
这项研究为胰岛素抵抗筛查提供了范式转变:通过AI方法将检测需求精简至"单次采血+体测"的组合,使家庭自测成为可能。特别在METS-IR预测中展现的临床级精度,为代谢综合征相关死亡率预警提供了实用工具。研究同时揭示了腰围作为核心预测因子的临床价值,为社区医生开展IR初筛提供了明确指标。未来工作需在更广泛人群中验证模型稳定性,并探索纳入生活方式因素后的性能提升。
成果的创新性体现在三方面:1) 首次实现基于单一血液指标的IR多标准评估;2) 开发出可直接输出METS-IR数值的预测系统;3) 通过跨人种队列验证证实算法普适性。这种"极简主义"设计尤其适合医疗资源匮乏地区,有望缩小糖尿病早期诊断的全球差距。
生物通微信公众号
知名企业招聘