绘制274,241名成年人血浆代谢组与人类健康和疾病的全面图谱:揭示代谢物-表型关联及其因果机制

【字体: 时间:2025年09月20日 来源:Nature Metabolism 20.8

编辑推荐:

  本刊推荐:本研究利用英国生物银行(UK Biobank)数据,构建了迄今最全面的人类代谢组-表型组图谱,系统揭示了313种血浆代谢物与1,386种疾病和3,142种表型之间的关联。研究发现超过57%的代谢物在疾病发生前十年已出现显著变化,机器学习构建的代谢风险评分(MetRS)对94种流行病和81种发病疾病表现出优异预测效能(AUC>0.8),孟德尔随机化分析进一步验证了454对代谢物-疾病的潜在因果关系。该研究为精准医疗提供了宝贵的生物标志物和治疗靶点资源。

  

研究概述与人群特征

本研究基于英国生物银行(UK Biobank)的274,241名参与者数据,通过核磁共振(NMR)技术检测了313种血浆代谢物,构建了全面的人类代谢组-表型组关联图谱。参与者中位年龄58.0岁,女性占54.0%,95.1%为白人 ancestry,中位随访时间14.9年。研究涵盖了1,386种疾病(527种流行病和859种发病疾病)和3,142种健康相关性状(包括991种健康性状和2,151种影像学性状)。

代谢物-疾病关联图谱

通过逻辑回归和Cox比例风险模型分析,研究发现了52,836个代谢物-疾病关联,其中横断面分析识别出18,594个显著关联(P<3.03×10-7),前瞻性分析识别出34,242个显著关联(P<1.86×10-7)。大低密度脂蛋白中胆固醇与总脂质比例(L-LDL-C%)被确定为关联疾病数量最多的代谢物,与203种流行病和323种发病疾病相关。

亚组分析揭示了显著的性别和年龄异质性。在消化系统疾病中,高密度脂蛋白(HDL)大小、大HDL总脂质(L-HDL-L)和大HDL游离胆固醇(L-HDL-FC)在女性中表现出保护效应,而在男性中却与风险增加相关。循环系统疾病中,总脂蛋白颗粒脂质(Total-L)、中LDL胆固醇酯(M-HDL-CE)和中VLDL磷脂(M-VLDL-PL)对中年人群是风险因素,对老年人群却具有保护作用。

代谢物-表型关联发现

研究发现了62,887个代谢物-健康性状关联和10,752个代谢物-影像性状关联。饮食偏好和物理测量是关联数量最多的性状类别。血液和尿液检测中的高光散射网织红细胞计数与最多代谢物相关(n=278),其中ω-6脂肪酸占总脂肪酸百分比(omega-6%)和小HDL甘油三酯表现出最显著的关联。

脑影像分析显示,代谢物与T1结构脑MRI关联最强,糖蛋白乙酰基(GlycA)和多不饱和脂肪酸/单不饱和脂肪酸比值与皮层下区域体积的关联最为显著。研究发现14种代谢物同时与饮食偏好和腹部MRI特征相关,9种代谢物与心脏MRI和循环系统疾病共同关联。

代谢物随时间变化的疾病进展特征

采用巢式病例对照设计,研究描绘了疾病诊断前15年代谢物的变化模式。在34,242个显著代谢物-疾病对中,57.5%的代谢物在疾病发生前十年已开始出现变化,30.0%在发病前5年内开始变化。

通过层次聚类,疾病被分为44个具有相似代谢变化模式的集群。集群1包含代谢性和心血管疾病及听觉障碍,这些疾病共享脂质失调和动脉粥样硬化等生物学机制。集群27包含血液系统恶性肿瘤,其特征是造血和免疫调节紊乱。

代谢物随年龄变化模式

研究分析了40-70岁年龄段代谢物的变化趋势,299种与衰老相关的代谢物被分为6个具有不同变化模式的集群。差异表达滑动窗口分析(DE-SWAN)发现了46岁和64岁两个代谢物表达高峰年龄。虽然这两个年龄点的顶级衰老相关代谢物有所不同,但存在显著重叠(n=161)。ω-6/ω-3脂肪酸比值和组氨酸/柠檬酸盐比值(His/Citrate)在两个高峰年龄均呈现下降趋势,而大多数顶级衰老相关代谢物在46岁上升,在64岁下降。

机器学习代谢风险评分的疾病预测效能

基于LightGBM算法构建的代谢风险评分(MetRS)在疾病预测中表现出色。对于发病疾病,MetRS对100种疾病(11.6%)的AUC超过0.7,其中28种疾病AUC超过0.80。糖尿病并发症的预测效能尤其突出,糖尿病性黄斑病变、糖尿病肾衰竭和伴外周循环并发症的2型糖尿病(T2D)的AUC分别达到0.921、0.919和0.913。

结合人口统计学信息后,81种疾病的AUC超过0.8。与单纯人口统计学模型相比,MetRS在61种疾病(7.1%)中表现更优,在527种疾病(61.4%)中提供了附加预测价值。

肌酐、GlycA、白蛋白和乙酸盐被确定为最重要的代谢标志物。肌酐和GlycA分别在189种(22.0%)和103种(12.0%)疾病的预测中最为重要。SHapley加性解释(SHAP)值分析显示,葡萄糖/鞘磷脂比值(Glu/SM)和葡萄糖水平升高增加未来T2D风险,而极小VLDL胆固醇酯百分比(XS-VLDL-CE%)降低表明风险降低。肌酐和谷氨酰胺/甘氨酸比值(Gln/Gly)升高与心肌梗死风险增加相关,而大HDL胆固醇酯(L-HDL-CE)和白蛋白水平具有保护作用。

孟德尔随机化与共定位分析揭示因果关系

正向孟德尔随机化分析确定了7,570个潜在的因果代谢物-疾病关联(q值<0.05)。在经过敏感性分析排除与饮食摄入相关的SNP后,6,196个(81.9%)关联仍然显著。采用更严格的工具变量选择标准后,确定了544个关联,其中454个在主要和敏感性分析中均保持一致。

白蛋白与最多疾病相关(n=15),与溃疡性结肠炎、某些类型贫血和慢性肾病(CKD)的风险增加正相关。极大VLDL磷脂百分比(XL-VLDL-PL%)对家族性高胆固醇血症的风险增加效应最大(OR=5.03),而小HDL游离胆固醇百分比(S-HDL-FC%)的保护作用最为明显(OR=0.35)。

反向孟德尔随机化分析发现了2,679个疾病-代谢物关联,大LDL甘油三酯百分比(L-LDL-TG%)与最多疾病相关。有趣的是,白蛋白水平与溃疡性结肠炎、某些类型贫血和CKD的遗传易感性存在双向因果关系。

共定位分析为402对代谢物-疾病关联提供了共享遗传决定的证据(PP.H4>0.80)。内分泌代谢和循环系统疾病类别的共定位信号数量最多。小LDL磷脂(S-LDL-PL)具有最多的共定位信号,与9种独特疾病共享176个变异。PCSK9基因中的rs11591147可能是S-LDL-PL与多种疾病关联的因果变异。

交互式网络工具与研究意义

研究者开发了交互式网络工具(https://metabolome-phenome-atlas.com/),包含四个主要模块:流行病学关联、代谢物随时间变化评估、基因组学关联和疾病判别分析。该工具采用CC BY-NC-ND 4.0许可,仅供非商业使用。

这项研究构建了迄今为止最全面的人类代谢组-表型组图谱,揭示了代谢组与人类健康和疾病的全面联系。研究发现超过一半的代谢物在疾病发生前十年已经开始变化,机器学习构建的MetRS对多种疾病表现出优异预测效能,孟德尔随机化分析揭示了数百对潜在的因果代谢物-疾病关联。这些发现为疾病机制理解、生物标志物发现和治疗靶点识别提供了宝贵资源,将推动精准医疗的发展。

研究局限性包括需要在独立外部数据集中进一步验证发现,NMR技术检测的代谢物范围有限,ICD-10编码在捕捉慢性进展性疾病全谱方面的不足,以及孟德尔随机化分析中难以完全隔离饮食影响等。未来研究需要在动物模型中进行基础实验验证发现,在国际联盟和多中心前瞻性外部队列中验证结果,并在基因-转录-蛋白质-代谢物连续体中进行全面研究。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号