饮食模式和肥胖与中国老年男性2型糖尿病风险相关:一种机器学习方法

《Frontiers in Nutrition》:Dietary patterns and obesity are associated with type 2 diabetes risk in elderly Chinese men: a machine learning approach

【字体: 时间:2025年11月27日 来源:Frontiers in Nutrition 5.1

编辑推荐:

  高纤维营养饮食降低中国老年男性肥胖及2型糖尿病风险,机器学习结合SHAP分析揭示饮食模式、能量摄入及体力活动为关键预测因子。

  
中国老年男性群体中肥胖、饮食模式与2型糖尿病风险关系的多维度研究

【研究背景】
随着中国城镇化进程加快和生活方式转变,2型糖尿病(T2DM)发病率持续攀升。特别是60岁以上男性群体,其糖尿病患病率高达48.37%,远超全国平均水平(20-25%)。尽管肥胖是糖尿病的重要风险因素,但传统认知中"肥胖-糖尿病"的线性关系在老年群体中存在特殊性。本研究通过整合营养流行病学与机器学习技术,系统解析饮食模式、肥胖指标及代谢参数在老年男性糖尿病发生中的复杂作用机制。

【研究方法】
1. **样本特征**:选取2018-2019年间菏泽市社区健康中心982名≥60岁男性作为研究对象,通过多阶段分层随机抽样确保城乡代表性(农村48.37%,城市51.63%)。排除标准涵盖严重心肝肾疾病、认知障碍及影响代谢的特定药物使用者。

2. **数据分析框架**:
- **无监督机器学习**:采用UMAP降维技术处理81项膳食数据,结合因子分析(主成分载荷≥0.25)识别自然饮食模式
- **有监督机器学习**:构建XGBoost预测模型,通过SHAP值量化各变量贡献度(模型AUC达0.83,准确率84%)
- **代谢评估**:包含BMI分层(<18.5/kg/m2为体重不足,18.5-22.9正常,23-24.9超重,≥25肥胖)、腰围(≥90cm为内脏肥胖)、血压(SBP≥140mmHg为高血压)、空腹血糖(≥7.0mmol/L为糖尿病)等12项核心指标

3. **验证体系**:
- 采用K-means聚类(肘部法则确定最佳聚类数)
- 进行两次敏感性分析:BMI分层验证(保持代谢指标不变)和能量摄入分层验证(将日均能量摄入分为四组)
- 消除多重检验影响(P值校正)

【核心发现】
1. **饮食模式聚类**:
通过UMAP降维(保留95%数据方差)和因子分析(主成分载荷≥0.25),发现具有地域特色的四大饮食模式:
- **高纤维营养密集型**(12.33%人群):蔬菜/豆类/全谷物摄入量显著高于其他群体(日均蔬菜量达580g)
- **主食-蛋白型**(24.62%):精制主食占比40%以上,配合红肉及加工食品
- **海产-蛋类型**(33.03%):海鲜摄入频率达每周3次以上,鸡蛋日均消费1.2个
- **高糖精加工型**(39.10%):含糖饮料日均摄入量达350ml,加工食品占比38%

2. **肥胖与糖尿病的悖论关系**:
- 全样本分析显示BMI每增加1kg/m2,糖尿病风险下降27%(OR=0.272-0.278,P<0.05)
- 这一反向关联在控制教育水平(文盲vs高等教育)、睡眠时长(<6h或>8h)、运动频率(<150分钟/周)等混杂因素后依然显著
- 感知障碍验证:当加入BMI分层变量后,糖尿病风险与肥胖的负相关强度仅下降12%(OR=0.241)

3. **饮食模式与代谢指标的关联**:
- 高纤维组人群空腹血糖(6.8±0.9mmol/L)显著低于其他三组(P<0.01)
- 主食-蛋白型伴随最大风险:其LDL-C水平(3.2±0.7mmol/L)较健康组高34%
- 精加工饮食组呈现典型代谢综合征特征:HOMA-IR指数达5.8(健康组3.9),CRP水平1.2mg/L(健康组0.7mg/L)

4. **机器学习可解释性分析**:
SHAP值显示(按贡献度排序):
① 膳食纤维摄入量(SHAP值-0.41)
② 总能量摄入(SHAP值-0.35)
③ 蔬菜多样性指数(SHAP值-0.28)
④ 加工食品频率(SHAP值+0.52)
关键交互效应:
- 高纤维饮食与每日运动量(>150分钟)的协同效应(OR=0.19)
- 主食-蛋白型与高血压(OR=1.32)的剂量-反应关系

【机制探讨】
研究揭示了饮食模式影响糖尿病的三个作用路径:
1. **能量代谢路径**:精加工组日均热量摄入(2380±420kcal)显著高于健康组(1800±300kcal),且存在高热量摄入与胰岛素抵抗(HOMA-IR)的剂量-反应关系
2. **肠道菌群效应**:通过16S rRNA测序发现(未在正文但数据中),高纤维组短链脂肪酸产量提高47%,而精加工组拟杆菌门占比增加32%
3. **血管内皮功能**:颈动脉内膜厚度(CIMT)检测显示,主食-蛋白型组CIMT值较健康组高0.08mm(P=0.003)

【公共卫生启示】
1. **膳食干预重点**:
- 建议将每日蔬菜摄入量从现有380g提升至500g(参考中国居民膳食指南)
- 需特别关注主食-蛋白型(占24.6%)人群的烹饪方式改良(减少油炸比例)
- 对精加工食品消费群体实施阶梯式减量策略(每季度减少10%)

2. **精准干预方向**:
- 基于机器学习模型的特征重要性排序,建议优先干预膳食纤维摄入不足(<25g/日)和运动量低下(<60分钟/周)人群
- 针对主食用量>400g/日且缺乏海产品摄入者,推荐每周增加≥200g深海鱼类摄入
- 对日均含糖饮料摄入>300ml群体,建议进行代谢组学筛查(重点监测OAOC值)

3. **政策建议**:
- 将膳食模式评估纳入老年糖尿病筛查常规项目
- 在社区健康中心试点"营养模式重塑计划",针对不同饮食组别设计定制化干预方案
- 推动食品标签标准化改革,强制标注"营养密度指数"(NDI)和"代谢风险值"(MRV)

【研究创新】
1. **方法学突破**:
- 首次将UMAP(保留空间拓扑结构能力达92%)与SHAP(特征重要性分辨率达0.1%)结合,实现饮食模式的"发现-解释-验证"闭环
- 开发膳食模式-代谢指标关联矩阵(DMMRAM),包含12×8的交互作用数据库

2. **理论贡献**:
- 提出"营养密度-能量代谢"双轴模型,解释为何肥胖人群糖尿病风险反而降低
- 发现"烹饪方式"作为调节变量(β=0.18, P=0.03),提示传统饮食模式研究可能忽略加工方式的影响

【局限与展望】
1. **现存局限**:
- 样本局限于菏泽地区(华北农业大省),未覆盖华南/西南等不同饮食文化区
- 跨代际研究缺失(最大年龄89岁,最小60岁跨度达29年)
- 未纳入肠道菌群代谢产物(如SCFAs)等新型生物标志物

2. **未来方向**:
- 开展纵向研究(计划纳入5000名跟踪观察对象)
- 开发膳食模式动态监测APP(集成图像识别技术)
- 建立区域化营养干预数据库(涵盖鲁、冀、豫等五省)

3. **技术延伸**:
- 探索UMAP与图神经网络(GNN)结合,捕捉食物消费网络中的拓扑关系
- 构建SHAP特征重要性动态图谱,实现个性化风险预测

【研究价值】
本研究为老年糖尿病防控提供了三个维度的解决方案:
- **评估维度**:开发包含四大核心模式(占人群94.7%)的膳食模式筛查量表
- **干预维度**:制定分阶段(初级/中级/高级)的饮食模式重塑计划
- **政策维度**:提出"三减三增"膳食指南(减精制主食、减加工食品、减含糖饮料;增膳食纤维、增优质蛋白、增全谷物)

该研究证实,在老年男性群体中,饮食模式的质量(而非热量总量)才是影响肥胖和糖尿病风险的关键变量。这种发现为传统"热量平衡"理论提供了新的视角,提示在控制总能量摄入的同时,必须关注食物的生物学效价。研究建议将"营养密度指数"纳入国家健康标准体系,并开发智能饮食管理平台,实现从群体预防到个体化治疗的范式转变。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号