《Communications Medicine》:Metabolomic sweet spot clock predicts mortality and age-related diseases in the Canadian Longitudinal Study on Aging
编辑推荐:
本研究针对传统生物年龄标志物线性假设强、可解释性差等局限,开发了基于代谢物最优水平("甜点")的非线性代谢组学时钟。通过对加拿大老龄化纵向研究(CLSA)队列的178种健康相关代谢物进行分析,发现基于偏离最优值的距离转换能显著提升死亡率预测效能(HR=1.08, p=5.8×10-12),并在85岁以上高龄队列中得到验证,为理解衰老异质性提供了可解释的生物标志物。
当我们谈论年龄时,通常指的是从出生开始计算的时间跨度——也就是 chronological age(时序年龄)。但生活中我们常会遇到这样的现象:两位相同时序年龄的老年人,一位可能精神矍铄、行动自如,另一位却可能多种慢性病缠身,健康状况截然不同。这种个体在衰老过程中表现出的巨大差异,被称为 aging heterogeneity(衰老异质性)。时序年龄无法准确反映个体真实的生理功能状态和健康程度,这促使科学家们寻找能够更准确衡量人体生物学衰老程度的指标——biological age(生物年龄)。
近年来,随着各种组学技术的发展,表观遗传时钟、蛋白质组时钟、代谢组时钟等多种生物年龄预测模型相继出现。其中,metabolomics(代谢组学)因其能够反映机体实时代谢状态,整合遗传、环境、生活方式等多种因素影响,而显示出独特优势。代谢物作为生命活动的终末产物,如同身体生理状态的"实时快照",理论上应该能提供关于生物年龄的灵敏指标。
然而,现有的代谢组学生物标志物面临几个关键挑战。许多模型假设代谢物水平与年龄或健康结局之间存在简单的线性关系,但越来越多的证据表明,许多生物标志物与健康的关系可能是非线性的,存在optimal levels(最优水平)或"sweet spots(甜点)"。例如,某种代谢物过高或过低都可能预示着健康问题。此外,传统模型通常使用原始代谢物水平,且往往包含大量与健康关联不明确的代谢物,导致模型可解释性差,也限制了其临床转化潜力。
为了解决这些问题,由Olga Vishnyakova、Joosung Min、Stephen Leach等研究人员组成的团队在《Communications Medicine》上发表了他们的最新研究成果。他们利用Canadian Longitudinal Study on Aging(CLSA,加拿大老龄化纵向研究)队列的大规模untargeted metabolomic profiling(非靶向代谢组学分析)数据,开发了一种名为"Sweet Spot Clock(甜点时钟)"的新型代谢组学生物年龄标志物。该研究的创新之处在于:首先通过variance heterogeneity(方差异质性)分析筛选与健康相关的代谢物;然后利用piecewise regression(分段回归)识别代谢物的最优水平;最后基于偏离这些最优值的距离构建预测模型。
研究人员采用了几项关键技术方法:从CLSA队列的9,061名45-85岁参与者中获取血浆样本进行非靶向代谢组学分析;通过方差异质性检验(Brown-Forsythe检验)筛选健康相关代谢物;使用分段回归确定代谢物最优水平;构建以Frailty Index(衰弱指数)为训练目标的ElasticNet回归模型;并在Super Seniors Study(超级老年人研究)队列中进行独立验证。
健康相关代谢物的识别与特征分析
研究团队首先使用五种健康评估工具对参与者健康状态进行量化,包括Frailty Index(FI,衰弱指数)、五种主要疾病(癌症、心血管疾病、慢性肺病、痴呆和糖尿病)数量、其他慢性病数量、认知功能和身体功能。基于"最健康个体代谢物水平方差较低"的假设,他们通过方差异质性分析发现,在888种内源性代谢物中,有178种(20%)至少在一种健康工具和性别中显示出显著的方差差异。
这些健康相关代谢物中,氨基酸、碳水化合物和脂质超通路包含最多显著异方差的代谢物。其中,N6,N6,N6-三甲基赖氨酸(TML)、葡萄糖和1-硬脂酰-2-亚油酰-GPI(18:0/18:2)分别代表了各超通路中方差差异最显著的标志物。通路富集分析显示,雄激素类固醇亚通路具有最显著富集(FDR调整p值=6.8×10-7)。
代谢物最优水平的确定与特征
研究人员采用分段回归分析,在178种健康相关代谢物中成功为74种(42%)确定了最优水平(甜点)。这些最优水平在男女性别间存在差异,仅12种代谢物的95%置信区间在性别间重叠。重要的是,55%的代谢物最优水平置信区间不包含零(即偏离群体均值),表明普通老年人群的平均代谢物水平并非最优状态。
例如,在女性中,古洛糖酸酯(gulonate)显示出最显著的效果变化(断点估计=-0.02,斜率=[-0.01,0.04],p=1.7×10-34);而在男性中,N6,N6,N6-三甲基赖氨酸的变化最为显著(断点估计=-0.31,斜率=[-0.11,0.01],p=1.7×10-34)。相关性分析发现,羟基天冬酰胺(hydroxyasparagine)和硫酸脱氢表雄酮(DHEA-S)与年龄的相关性最强。
甜点时钟的构建与性能验证
研究团队构建了四种不同的代谢组学时钟进行比较:Sweet Spot Clock(以FI为目标,使用甜点距离转换)、Baseline模型(以年龄为目标,使用原始代谢物水平)、ControlAge(以年龄为目标,使用甜点距离转换)和ControlMb(以FI为目标,使用原始代谢物水平)。
在测试集中,Sweet Spot Clock显示出与全因死亡率的最强关联(HR=1.08,p=5.8×10-12,C-index=0.841),性能优于其他模型。进一步分析表明,以FI为训练目标和使用甜点距离转换均对性能提升有贡献。该生物标志物还与多种年龄相关疾病的发病风险显著相关,包括糖尿病(HR=1.05,p=8.9×10-14)、慢性阻塞性肺疾病(HR=1.05,p=3.1×10-7)、卒中(HR=1.07,p=2.1×10-4)和肾脏疾病(HR=1.05,p=0.02)。
代谢组年龄偏差的关联分析
全基因组关联分析(GWAS)发现,代谢组年龄偏差(MAD)的SNP遗传力为0.23(SE=0.01),并在1号染色体1p36.32区域发现一个显著位点(rs11809159)。关联分析显示,MAD与多种炎症标志物(如高敏C反应蛋白、肿瘤坏死因子-α、白细胞介素-6)、心理困扰、BMI、糖化血红蛋白等显著相关。社会经济变量方面,较低的家庭收入和教育程度与较高的MAD相关。
与现有表观遗传时钟的比较发现,MAD与DNAm GrimAge时钟呈中等相关(r2=0.38),而与Hannum时钟、Horvath泛组织时钟和DNAm PhenoAge的相关性较弱。在同时包含代谢组和表观遗传数据的子集中,结合MAD和GrimAge v2的多组学模型显示出最高的预测性能(C-index=0.806)。
独立队列验证与泛化性评估
在Super Seniors Study独立队列(667名85岁以上参与者)中,Sweet Spot Clock无需重新训练即显示出良好的泛化能力。超级老年人(无重大慢性病史)的MAD显著低于年龄匹配的对照组(-0.4岁 vs 1.1岁)。MAD与超级老年人表型(OR=1.16,p=2.8×10-6)和死亡率(HR=1.08,p=3.3×10-5)均显著相关。
然而,在CLSA的亚洲和黑人 ancestry(祖源)亚组中,由于样本量较小和死亡事件稀少,未能验证MAD与死亡率的显著关联,提示未来需要在更多样化人群中进一步验证。
研究结论与意义
该研究开发的Sweet Spot Clock通过聚焦健康相关代谢物并明确建模非线性关系,克服了现有代谢组学生物标志物的多个局限性。与训练于时序年龄或死亡终点的传统模型不同,该研究选择Frailty Index这一反映多系统功能下降的中间表型作为训练目标,更能捕捉衰老异质性的生物学本质。
研究表明,许多代谢物存在与健康相关的最优水平,且这些水平往往偏离人群平均值,提示普通人群的平均代谢状态并非最优。通过将代谢物水平转换为偏离最优值的距离,显著提升了生物年龄预测的准确性。该标志物在独立高龄队列中的验证成功,证明了其稳健性和泛化能力。
尽管该研究主要基于欧洲祖源人群,且采用相对定量的代谢组学数据,但提出的"甜点"概念和建模框架为生物年龄研究提供了新范式。未来研究需要在更多样化人群和绝对定量平台上验证这些发现,并探索这些代谢物最优水平随年龄动态变化的规律。
Sweet Spot Clock不仅为衰老生物学研究提供了新工具,也为未来开发针对代谢稳态的干预措施提供了潜在靶点。通过识别偏离最优代谢状态的个体,可能为早期健康风险预警和个性化健康管理提供新策略。