超越BMI:机器学习视角下印度女性糖尿病风险的最优肥胖指标识别

《International Journal of Diabetes in Developing Countries》:Beyond BMI: Machine Learning approach to identify superior obesity indicators for diabetes risk among Indian women

【字体: 时间:2025年11月20日 来源:International Journal of Diabetes in Developing Countries 0.9

编辑推荐:

  本研究针对印度育龄女性糖尿病筛查中传统BMI指标的局限性,创新性地采用机器学习方法对比五种肥胖指标(BMI、WC、WHtR、WHpR及wBMI)的预测效能。基于全国代表性NFHS-5数据(n=613,752),研究发现wBMI(腰围校正BMI)与WC、WHtR均优于BMI,其中wBMI的AUPRC达0.105,灵敏度为63.6%。研究为资源有限地区的糖尿病精准筛查提供了非侵入性、可扩展的解决方案,对印度公共卫生政策具有重要实践意义。

  
在印度这个被称为“世界糖尿病之都”的国家,糖尿病早已不再是城市富裕人群的“专利”,而是悄然蔓延至社会经济弱势群体,尤其对育龄女性构成严重威胁。传统上,身体质量指数(BMI)一直是糖尿病筛查中最常用的肥胖指标,但它有一个致命缺陷——无法反映体内脂肪的分布情况。而印度人群恰恰具有“隐藏性肥胖”的特点:即使BMI正常,也可能存在大量内脏脂肪,这种脂肪与胰岛素抵抗的关系更为密切。那么,在糖尿病筛查中,是否存在比BMI更有效的肥胖指标?
为了回答这个问题,研究人员Sadhvi Gurudatha和Ritanjali Majhi开展了一项大规模研究,论文发表在《International Journal of Diabetes in Developing Countries》。他们利用印度第五轮全国家庭健康调查(NFHS-5)的庞大数据,分析了61万余名15-49岁非孕女性的健康信息,创新性地采用机器学习方法,系统比较了五种肥胖指标对糖尿病的预测能力。
研究团队运用了多种机器学习技术,包括树模型(C5.0、随机森林、XGBoost)和惩罚回归模型(岭回归、LASSO、弹性网络)。针对数据中糖尿病患者仅占3.83%的类别不平衡问题,他们采用了过采样与欠采样相结合的方法处理训练集,并以AUPRC(精确召回曲线下面积)作为主要评估指标,这是处理不平衡数据的推荐指标。
研究结果
肥胖指标比较:中心性肥胖指标表现优异
研究发现,腰围校正BMI(wBMI)、腰围(WC)和腰围身高比(WHtR)都是良好的糖尿病预测指标,明显优于传统BMI。其中wBMI表现最佳,其中位数AUPRC为0.105,中位数灵敏度达63.6%。虽然这一绝对数值看似不高,但相较于糖尿病在人群中的基线患病率(3.8%,对应AUPRC基线为0.038),模型的判别能力提高了近三倍。
腰围身高比(WHtR)和腰围(WC)的表现紧随其后,中位数AUPRC均为0.102。而传统BMI和腰臀比(WHpR)的预测能力相对较弱,中位数AUPRC分别为0.1和0.09。这一结果凸显了中心性肥胖指标在糖尿病风险评估中的重要性,证实了脂肪分布模式比单纯的整体肥胖程度更能反映糖尿病风险。
机器学习模型比较:惩罚回归模型表现突出
在六种机器学习模型中,XGBoost获得了最高的中位数AUPRC(0.103),而惩罚回归模型(LASSO和岭回归)的整体表现优于树模型。
在最佳表现的十种模型中,有八种是惩罚回归模型(四种LASSO、三种岭回归和一种弹性网络),另外两种是XGBoost模型。这些模型使用的肥胖指标包括全部五种指标组合、wBMI单独使用、WC单独使用以及WHtR单独使用。
最佳模型特征:兼顾灵敏度与判别能力
研究将中位数AUPRC≥0.102且中位数灵敏度≥63.29%作为最佳模型的筛选标准。符合这一标准的模型主要依赖于wBMI、WC和WHtR这些中心性肥胖指标,并大多采用惩罚回归方法。这表明在大型数据集上,惩罚回归不仅训练效率高,预测性能也相当稳健。
讨论与意义
这项研究的重要发现在于,它首次在印度全国代表性样本中系统验证了wBMI这一相对较新的肥胖指标在糖尿病预测中的优越性。wBMI作为腰围与BMI的乘积,同时考虑了整体肥胖程度和腹部脂肪堆积,能更全面反映代谢风险。
与以往研究相比,本研究的优势在于使用了更严谨的糖尿病诊断标准(结合自我报告和随机血糖值),避免了仅依赖自我报告可能漏诊的问题。同时,研究采用AUPRC而非AUROC(受试者工作特征曲线下面积)评估模型性能,更适用于疾病患病率低的不平衡数据场景。
从公共卫生实践角度,这项研究的意义尤为突出。wBMI、WC和WHtR都是易于测量、非侵入性且成本低廉的指标,非常适合在资源有限的基层医疗机构推广使用。这对于印度“Madhumeh Mukt Bharat”等全国性糖尿病防控项目具有直接指导价值,建议这些项目考虑将中心性肥胖指标纳入常规筛查流程。
当然,研究也存在一些局限性,例如未能纳入糖尿病家族史、妊娠糖尿病史、体力活动水平等潜在影响因素。未来研究若能结合更多生活方式和遗传因素,有望进一步提升模型预测性能。此外,由于缺乏独立的外部数据集,模型的有效性尚未经过外部验证。
结论
本研究通过机器学习方法分析印度全国性健康调查数据,明确显示中心性肥胖指标(特别是wBMI、WC和WHtR)在预测育龄女性糖尿病风险方面优于传统BMI。惩罚回归模型在此类大型数据集上表现出色,为实现精准、可扩展的糖尿病筛查提供了技术支撑。研究成果为印度及类似背景国家的公共卫生政策制定者提供了科学依据,推动糖尿病筛查从依赖BMI向更精准的中心性肥胖指标转变,有望在资源有限条件下实现更高效的早期干预和疾病预防。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号