器官特异性蛋白质组衰老模式:生活方式、疾病与死亡风险的关联研究

【字体: 时间:2025年10月11日 来源:Aging Cell 7.1

编辑推荐:

  本综述基于英国生物银行(UKB)44,610名参与者的血浆蛋白质组数据,通过弹性网络正则化(elastic net regularization)构建了11个器官系统的特异性衰老时钟。研究系统揭示了吸烟、饮酒、体力活动等86种生活方式因素对器官衰老的调控作用,并通过全表型组关联分析(PheWAS)发现加速衰老与657种疾病风险及全因死亡率显著相关。特别指出慢性肾脏病(CKD)患者多器官衰老加速达2.85年,脑衰老对死亡风险的预测效能最强(HR=1.62)。研究为器官特异性衰老的可干预性提供了大规模证据,为精准预防策略奠定基础。

  

1 引言

衰老是器官系统生理功能进行性衰退的主要风险因素,驱动年龄相关疾病易感性和死亡风险增加。然而,衰老过程在个体间存在显著异质性,这种变异性源于生物衰老的差异,可能受整体健康状况和生活方式选择等因素塑造。与 chronological age(时序年龄)不同,biological aging(生物衰老)反映了分子和细胞损伤的累积,导致器官功能紊乱,使其成为疾病风险和死亡率的更稳健预测指标。
关键的是,衰老在同一个体的不同器官中并非均匀进展。动物研究揭示了器官间 distinct molecular aging signatures( distinct molecular aging signatures),近期人类研究也表明器官和生物过程衰老速率的类似变异性,强调了在个体器官水平评估衰老的重要性。传统方法依赖临床指标评估器官功能方面,如血液生化参数、大脑MRI成像、epigenetic markers(表观遗传标记)以及血液中特定器官蛋白质的浓度,但往往缺乏对精确器官水平衰老评估的特异性。
血浆蛋白质组学的最新进展导致了器官特异性衰老时钟的发展,揭示了 distinct aging trajectories( distinct aging trajectories)及其临床相关性。Oh等人(2023)的开创性工作利用基因组织表达图谱(GTEx)衍生的器官富集蛋白质和应用于血浆数据的最小绝对收缩和选择算子(lasso)模型,引入了器官特异性蛋白质组时钟,并将其与健康结局联系起来。然而,可改变生活方式因素的广泛影响、疾病关联和死亡风险仍未得到充分探索。需要进行全面分析以了解跨器官蛋白质组衰老的可改变驱动因素和健康后果。
本研究应用源自英国生物银行(UKB)血浆蛋白质数据的器官特异性蛋白质组年龄估计器。通过对86个生活方式因素和657种疾病进行全面的全表型组关联分析(PheWAS),评估了它们对疾病风险和全因死亡率的影响。我们对器官解析的衰老模式进行 mapping,提供了超越传统全身测量的对生物衰老的细致理解。此外,我们确定了减缓器官衰退的关键可改变因素,提供了可操作的干预见解。

2 材料与方法

2.1 研究参与者与器官特异性血浆蛋白的识别

UKB是一项基于人群的前瞻性队列研究,在2006年至2010年间招募了超过50万名年龄在37至73岁的参与者。我们主要纳入了UKB队列中随机选择的53,013名具有可用基线Olink Explore蛋白质组数据的参与者。经过严格的数据处理和质控步骤后,最终分析数据集包括44,610名参与者和2916种蛋白质。
为了识别器官特异性血浆蛋白,我们采用了先前研究中描述的方法。器官富集基因被定义为在一个器官中的表达水平至少比其他所有器官高四倍,这些基因源自GTEx提供的人类组织 bulk RNA-seq 数据。这些器官富集基因随后被映射到它们相应的蛋白质,从而能够在UKB数据中识别器官特异性血浆蛋白。

2.2 器官特异性蛋白质组年龄估计

为准备蛋白质组数据进行模型训练,采用k-最近邻(k-NN)算法估算缺失值。使用出生年份、出生月份和首次评估日期计算每位参与者的基线时序年龄。时序年龄计算为出生日期与评估日期之间的间隔(以月为单位)。
我们采用了弹性网络正则化,它有效结合了lasso和ridge regression的优势。该方法通过纳入L1和L2惩罚同时进行特征选择和系数收缩。分别针对女性和男性参与者训练弹性网络回归模型以预测器官特异性年龄。数据随机分为训练集(80%)和测试集(20%)。定义了超参数网格,alpha(控制L1和L2正则化的混合)范围从0到1,步长为0.05,lambda(正则化强度)在1×10?2到1的对数尺度上跨度。使用重复5折交叉验证策略进行超参数调优,优化平均绝对误差(MAE)。使用 caret R包中的train函数在超参数空间上进行网格搜索。选择性能最佳的alpha和lambda值,并使用这些最优超参数在整个训练数据集上训练最终的弹性网络模型。然后将训练好的模型应用于训练集和测试集以生成蛋白质组年龄估计。使用器官特异性血浆蛋白为每个器官训练单独的衰老模型。此外,使用所有可用蛋白质训练了一个“蛋白质”衰老模型。
年龄差距(age gap)定义为预测年龄与时序年龄之间的差值,正值表示预测年龄较老,负值表示预测年龄较年轻。为纠正年龄预测中的系统偏差(即倾向于低估老年人年龄和高估年轻人年龄),我们对预测年龄(PredAge)与时序年龄进行了线性回归。使用得到的斜率(α)和截距(β)通过以下公式调整预测:PredAge (age bias adjusted) = PredAge + [Age - (α × Age + β)]。
偏差校正后,年龄差距通过从调整后的预测年龄中减去时序年龄得出,然后在每个衰老模型内进行z-score标准化。在任何衰老模型中,z-score年龄差距超过1或低于-1的个体被归类为极端衰老者。

2.3 生活方式因素、健康结局和死亡率

我们测试了z-score标准化年龄差距与生活方式因素之间的关联。总共选择了86个变量来捕捉 sociodemographic factors(社会人口因素)和 lifestyle factors(生活方式因素)的个体差异。连续变量进行z-score标准化,使其均值为0,标准差为1。使用线性回归评估器官特异性z-score年龄差距与生活方式因素之间的关系,同时调整性别和时序年龄。此外,检查了器官特异性年龄与全因死亡率的前瞻性关联。死亡率数据通过链接到国家死亡登记处获得。
此外,我们通过PheWAS方法调查了z-score年龄差距与 incident diseases(发病疾病)之间的关联。我们使用Cox比例风险模型,将器官特异性z-score年龄差距作为感兴趣的暴露因素,调整时序年龄和性别。疾病结局使用Phecode Map X定义,该映射基于标准化ICD-10代码将3612种疾病定义组织成临床相关类别。考虑到我们对发病疾病的兴趣和样本的年龄分布,我们排除了与妊娠相关状况、先天性异常、泌尿生殖系统疾病、新生儿疾病和性别特异性疾病对应的Phecodes。诊断代码从国家医院数据和门诊全科医生访问数据中获得。为确保模型稳定性,我们将分析限制在至少发生100起发病事件的疾病,最终共有657种疾病用于进一步分析。
我们还探讨了器官特异性年龄与16种慢性疾病之间的关联,包括帕金森症、多发性硬化症、中风、痴呆、抑郁症、双相情感障碍、精神分裂症、缺血性心脏病(IHD)、高血压性疾病、慢性阻塞性肺疾病(COPD)、慢性肾脏病(CKD)、糖尿病、肝硬化、骨关节炎、骨质疏松症和癌症。

2.4 统计分析

所有统计分析均使用R(v.4.4.1)进行。使用线性回归测试z-score年龄差距与生活方式/环境因素之间的关联。使用双侧t检验确定特定慢性疾病中平均z-score年龄差距是否与0显著不同。基于蛋白质年龄差距的生存概率使用Kaplan-Meier方法估计。采用Cox比例风险模型测试z-score年龄差距与发病结局(死亡率和疾病)之间的关联。生存结局基于到首次发病事件的随访时间和表示疾病发生的二元指标。所有发病疾病分析均排除了 prevalent cases(流行病例)。所有模型均调整了时序年龄和性别。使用Bonferroni方法通过控制家族错误率(FWER)校正p值以进行多重比较。

3 结果

3.1 器官特异性蛋白质组年龄估计

我们的研究设计和主要分析方法概述如图1所示。我们利用来自44,610名UKB参与者(54.09%为女性,年龄39-71岁)子集的血浆蛋白质数据来估计整体和器官特异性蛋白质组年龄。我们的分析集中于11个主要器官:脂肪、动脉、大脑、心脏、免疫、肠道、肾脏、肝脏、肺、肌肉和胰腺。识别了可能源自这些器官的血浆蛋白并用于训练预测模型。
分别针对女性和男性参与者开发了蛋白质组年龄估计的预测模型,以更好地捕捉各自的蛋白质变化特征。在每个性别组内,数据集随机分为80%训练集和20%测试集。我们采用弹性网络正则化来训练衰老模型。我们使用质控后数据集中所有可用蛋白质构建了一个“蛋白质”年龄模型,并基于与每个器官相关的血浆蛋白质构建了11个器官特异性蛋白质组年龄模型。我们分析了年龄差距的特征,并调查了蛋白质组年龄与86种生活方式和环境因素以及657种疾病之间的关联。此外,我们评估了器官特异性蛋白质组年龄对16种主要慢性疾病风险和全因死亡率的影响。

3.2 衰老模型的性能

衰老模型的预测性能在男性和女性的训练集和测试集上均保持稳定,具有相似的MAE。具体而言,“蛋白质”模型的MAE在女性训练集中为2.01年,测试集中为2.17年;在男性训练集中为2.11年,测试集中为2.33年。还训练了以性别为协变量的预测模型来估计蛋白质组年龄。两性合并模型的MAE相对大于仅女性模型,略低于仅男性模型。从性别分层模型和两性合并模型得出的预测蛋白质组年龄之间的Pearson's r很高(r = 0.99)。
我们观察到所有模型都表现出一致的偏差模式,即高估年轻参与者的年龄,同时低估年长参与者的年龄。我们应用了预测年龄对时序年龄的回归来校正这一点。这种调整显著提高了预测准确性,将所有器官的MAE降低到0.92至3.21年之间,证明了模型性能的整体提升。

3.3 器官年龄差距的成对相关性

偏差校正后,大多数个体的年龄调整后蛋白质组年龄与其时序年龄相似,差异围绕零中心分布。女性的分布比男性更集中,表明蛋白质组衰老模式可能存在性别相关差异。对不同器官间年龄差距相关性的进一步检查揭示了 substantial variability( substantial variability),从弱相关到强相关不等,表明蛋白质组衰老加速在不同器官系统间存在差异。
高相关性表明器官共享相似的衰老过程,而低相关性表明衰老过程的不一致性。例如,动脉和肝脏年龄差距之间存在显著相关性,免疫和脂肪年龄差距之间也存在显著相关性。相反,心脏与其他器官系统年龄差距之间的相关性似乎较低。为了在后续分析中实现器官间的直接比较,我们通过计算预测年龄与时序年龄的差值,然后对每个衰老模型应用z-score标准化来标准化年龄差距。在每个衰老模型中,z-score年龄差距大于1(定义为“较老”组)或小于-1(定义为“较年轻”组)的个体被视为极端衰老者。z-score年龄差距在-1和1之间的个体被视为“中间”组。

3.4 器官特异性年龄受生活方式/环境因素和基线健康状况影响

为了研究生活方式和环境因素如何影响不同器官系统的蛋白质组衰老,我们使用线性回归测试了86个生活方式因素与12个z-score年龄差距之间的关系,调整了时序年龄和性别。
吸烟相关行为成为最重要的风险因素,加速了大多数器官的衰老,其中对肺的影响最大,其次是大脑和肠道。例如,成年后吸烟包年数占生命暴露吸烟比例较高的个体,在肺、肾和肠道的年龄偏差显著更高。曾经吸烟或目前吸烟与加速衰老相关,并且在较年轻时开始吸烟进一步加剧了这种效应。频繁饮酒显示对脂肪、肝脏和肾脏的衰老加速作用最大,但似乎略微减缓了肠道的衰老。值得注意的是,餐中饮酒对大多数器官具有保护作用。每周进行超过10分钟的中等强度和剧烈体力活动的天数较多与蛋白质组年龄减速相关,而久坐行为(如看电视和使用电脑)则与加速衰老相关。包含水果、蔬菜和油性鱼类的营养饮食与脂肪、肠道、肾脏和胰腺的蛋白质组衰老减速显著相关。然而,饮食变化对应于脂肪和肠道年龄的加速。不良睡眠模式,包括失眠、白天小睡和发作性睡病,也与某些器官(如大脑和免疫系统)的蛋白质组衰老加速相关。较高的社会经济地位,如较低的Townsend剥夺指数、家庭拥有更多车辆以及较高的家庭平均总收入,与大多数器官的蛋白质组衰老减速显著相关。
我们还调查了基线前慢性疾病诊断对蛋白质组衰老的影响。患有慢性疾病的个体被分为16个疾病类别。平均而言,患有慢性疾病的个体相对于其时序年龄在大多数器官中表现出加速衰老,通常范围在-0.17至2.85年之间。患有CKD的个体受到的影响 substantially greater( substantially greater),在大多数器官中显示年龄加速超过1.5年,其次是肝硬化和糖尿病。
器官特异性年龄在不同疾病间甚至疾病内部表现出 substantial heterogeneity( substantial heterogeneity)。受潜在疾病直接影响的器官往往显示出最显著的年龄差距。例如,在CKD中观察到肾脏显著年龄加速(+2.85年),糖尿病中胰腺加速(+0.86年),抑郁症中大脑加速(+0.42年),IHD中心脏加速(+0.78年)。值得注意的是,一些疾病在通常与其主要病理学不相关的器官中也显示出加速衰老。加速的大脑衰老不仅在神经系统疾病如多发性硬化症(+0.85年)、中风(+0.72年)和精神分裂症(+0.50年)中观察到,而且在CKD(+1.78年)、糖尿病(+0.71年)和IHD(+0.33年)中也观察到。值得注意的是,CKD在七个器官中显示出年龄加速超过1.5年的 substantially greater impact( substantially greater impact)。相比之下,某些器官在特定疾病中表现出轻微的蛋白质组年龄减速,尽管这些发现不具有统计学显著性。

3.5 蛋白质组年龄差距预测死亡率

我们根据年龄差距将个体分为三组(较年轻:z-score年龄差距 < -1;较老:z-score年龄差距 > 1;中间:z-score年龄差距在-1和1之间)。器官特异性年龄差距与全因死亡率 strongly associated( strongly associated)。
为了评估这些关系,我们使用多变量Cox比例风险模型进行了前瞻性分析,调整了时序年龄和性别。在“蛋白质”模型中,z-score年龄差距每增加一个单位与更高的全因死亡风险相关,风险比(HR)为1.33(95% CI: 1.30 至 1.37, p < 0.001)。按时序年龄分层的进一步分析显示,较高的“蛋白质”年龄差距与所有年龄组的死亡风险增加相关。值得注意的是,在具有相同蛋白质组年龄差距的个体中,时序年龄较年轻的人面临更高的全因死亡风险。这表明发生在生命早期的加速蛋白质组衰老尤其有害,导致不成比例的更高死亡风险。
关于器官特异性年龄差距与全因死亡率之间的关联,器官年龄差距增加 consistently linked( consistently linked)到更高的死亡风险。观察到的最强关联是脑年龄(HR = 1.62, 95% CI: 1.58 至 1.66, p < 0.001),而最弱的是肌肉年龄(HR = 1.19, 95% CI: 1.16 至 1.22, p < 0.001)。比较“较老”组与“中间”组的个体,那些具有加速衰老过程的个体表现出更高的全因死亡风险。相反,“较年轻”组的个体在大多数器官系统中显示出显著降低的死亡风险,除了肌肉(HR = 1.10, 95% CI: 1.02 至 1.18, p = 0.018)。观察到器官特异性蛋白质组年龄与全因死亡率之间存在显著的非线性关系,表明加速的蛋白质组年龄与更高的全因死亡风险显著相关,而减速的蛋白质组年龄与更低的全因死亡风险相关。

3.6 器官特异性年龄预测未来疾病

我们检查了“蛋白质”年龄差距是否可以预测未来的健康结局和疾病风险。使用多变量Cox比例风险模型并调整时序年龄和性别,我们评估了至少发生100起发病事件的657种疾病的关联。“蛋白质”衰老的加速与某些疾病风险升高显著相关(202个显著关联,占所有测试疾病的30.7%),HR范围从1.07到1.68(100%的显著关联)。
最强的关联在心血管、内分泌/代谢、神经系统和呼吸系统疾病中观察到,表明由蛋白质反映的加速蛋白质组衰老可能是系统性健康衰退的早期预测指标。例如,具有加速“蛋白质”衰老的个体表现出发生诸如肝衰竭(HR = 1.68, 95% CI: 1.43 至 1.98, p < 0.001)、室性心动过速(HR = 1.66, 95% CI: 1.46 至 1.89, p < 0.001)、低血糖症(HR = 1.54, 95% CI: 1.39 至 1.70, p < 0.001)和血管性痴呆(HR = 1.48, 95% CI: 1.30 至 1.68, p < 0.001)等疾病的可能性增加。
我们还检查了z-score器官特异性年龄差距与未来疾病风险之间的关系。最强的关联在心血管、内分泌/代谢、感染、神经系统和呼吸系统疾病中观察到。观察到一个一致的模式,即特定器官的加速衰老与主要影响该器官系统的疾病风险增加相关。例如,动脉和心脏的加速衰老与心血管疾病的 greater susceptibility( greater susceptibility)显著相关,大脑的加速衰老与心理健康和神经系统疾病风险升高显著相关。
有趣的是,一个器官的加速衰老也可能与超出其主要病理学领域的疾病风险增加相关。一个突出的例子是肾脏加速衰老与跨多个疾病系统(包括心血管、内分泌/代谢、神经系统和呼吸系统疾病)风险升高之间的显著关联。有趣的是,脂肪加速衰老与腹股沟疝风险降低相关(HR = 0.78, 95% CI: 0.74 至 0.83, p < 0.001)。

3.7 较高的器官特异性年龄增加年龄相关慢性疾病风险

为了进一步探索器官年龄与未来慢性疾病风险之间的关系,我们检查了12个蛋白质组衰老时钟与16种主要慢性疾病之间的关联。结果显示器官年龄增加与多种慢性疾病风险升高之间存在显著相关性。特定器官,如心脏、肝脏和免疫系统,与疾病易感性表现出 particularly strong associations( particularly strong associations),表明某些器官可能更容易受到衰老的影响。
例如,肾脏年龄增加与CKD(HR = 1.67, 95% CI: 1.63 至 1.71, p < 0.001)、糖尿病(HR = 1.54, 95% CI: 1.51 至 1.58, p < 0.001)以及几种其他慢性疾病 strongly associated( strongly associated)。值得注意的是,预测的脑年龄与大多数主要慢性疾病的风险显示出显著关联,强调了其作为系统性衰老和疾病脆弱性的 broad indicator( broad indicator)的潜力。
我们进一步检查了器官年龄的极端偏差如何影响疾病风险。正的极端器官年龄表明预测的器官年龄属于“较老”组。相反,负的极端器官年龄表明预测的器官年龄属于“较年轻”组。特定器官年龄属于“较老”组的个体面临发展慢性疾病的显著增加风险。相比之下,“较年轻”组表现出较低的风险,表明维持特定器官中减速的蛋白质组年龄可能 confer protective health benefits( confer protective health benefits)。
例如,“较老”的肾脏衰老者与肝硬化(HR = 2.90, 95% CI: 2.27 至 3.69, p < 0.001)和CKD(HR = 3.70, 95% CI: 3.39 至 4.03, p < 0.001)风险增加相关。相反,“较年轻”的肾脏衰老者患糖尿病(HR = 0.62, 95% CI: 0.54 至 0.71, p < 0.001)、CKD(HR = 0.55, 95% CI: 0.46 至 0.65, p < 0.001)和其他疾病的风险降低。

4 讨论

我们对UKB队列的分析提供了对估计蛋白质组年龄、生活方式因素和疾病之间关联的全面评估,突出了器官特异性蛋白质组衰老在塑造健康和疾病轨迹中的作用。研究结果表明,蛋白质组年龄差距有效捕捉了 distinct organ-specific aging patterns( distinct organ-specific aging patterns),同时突出了跨器官系统的共享机制。这些衰老动态受生活方式行为和现有疾病负担的调节,进而影响死亡率和未来疾病发展风险。这强调了系统性相互作用和潜在可改变的生物通路在塑造整体衰老过程中的重要性,增进了我们对蛋白质组特征如何为精准预防策略提供信息的理解。
我们的研究揭示了蛋白质组年龄差距的性别差异,女性通常表现出比男性更窄的分布。这表明男性衰老加速,可能归因于行为因素,如男性吸烟和饮酒率较高,或固有的生物学变异,包括较慢的炎症消退、更快的端粒缩短和不同的免疫反应。为了更精确地捕捉这些性别特异性动态,本研究采用性别分层的弹性网络模型,使用来自UKB的Olink蛋白质,在揭示 dimorphic protein effects( dimorphic protein effects)方面优于协变量调整。
我们的研究结果将加速的蛋白质组衰老与器官特异性疾病和总体死亡风险升高联系起来。例如,加速的肾脏衰老与糖尿病和高血压相关,心脏衰老与心脏事件相关,大脑衰老与神经系统疾病相关,这反映了Oh等人报告的模式。基于这些观察,我们的研究纳入了扩展的86个生活方式因素集,揭示了可改变的因素,如吸烟,会加速肺和肾脏的衰老。此外,涵盖657种疾病的PheWAS提供了对系统性相互联系的更广泛理解。两项研究都强调了与加速衰老相关的死亡风险增加,其中对脑衰老的
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号