人类泛疾病血液蛋白质组图谱:循环蛋白质组的全景解析与精准医学新资源

【字体: 时间:2025年10月11日 来源:SCIENCE 45.8

编辑推荐:

  本研究针对疾病生物标志物发现中特异性不足和跨疾病比较缺乏的问题,通过大规模血浆蛋白质组学分析,构建了涵盖59种疾病和健康人群的泛疾病资源。利用邻位延伸分析技术(PEA)对8,262个体进行5,416种蛋白质的检测,揭示了年龄、性别和BMI相关蛋白,并鉴定了疾病特异性特征。该研究提供了统一的蛋白质组数据集,有助于发现共享和特异的蛋白模式,为精准医学研究提供了重要在线资源。

  
在精准医学领域,寻找微创且可靠的生物标志物一直是研究人员面临的重大挑战。血液中的蛋白质能够全面反映健康状况,通过检测数千种循环蛋白质,可以为疾病诊断、患者分层和治疗监测提供关键信息。然而,传统的生物标志物研究多采用“病例-对照”设计,将目标疾病与健康个体直接比较,这种方法虽然简单,却存在明显局限性。疾病表型的复杂性和重叠性给生物标志物的发现带来了显著困难,大多数研究只关注单一疾病或与有限相关疾病进行比较,往往忽视了疾病间的相似性,这可能影响所识别标志物的特异性。因此,只有一小部分研究最终能够转化为临床应用,部分原因是基于狭窄病例对照比较得出的生物标志物往往缺乏更广泛临床应用所需的特异性和稳健性。此外,过去缺乏能够测量血液中低丰度蛋白质的敏感多重检测方法,也限制了临床相关生物标志物的发现。
随着质谱技术、适配体技术和抗体技术的发展,如今能够以高覆盖度和高通量分析血浆蛋白质组, enabling large-scale proteomics population studies。大规模蛋白质组学的潜力已在癌症和其他疾病的研究中得到证明,但大规模泛疾病血液蛋白质组研究仍较少报道。为了应对这一挑战,研究人员开展了了一项泛疾病研究,旨在和谐统一的蛋白质组数据集中研究多种疾病表型。
这项研究发表在《SCIENCE》上,通过使用基于邻位延伸分析(PEA)的下一代靶向蛋白质组学技术,分析了健康个体和确诊患者的血液谱。共分析了来自8,262个体的9,027个样本,测量了超过5,400个蛋白质靶标。研究利用了四个“内部”数据生成的队列,包括健康个体的纵向队列和疾病个体的队列。健康队列来自瑞典心肺生物图像研究(SCAPIS)生物库,包括96名50至65岁的个体,在两年内进行了六次随访。此外,还分析了来自BAMSE出生队列的100名参与者,从儿童期到成年期进行了四次采样。疾病队列包括6,074个血浆样本,涵盖59种疾病和健康对照, collectively referred to as the Human Disease Blood Atlas (HDBA) resource。疾病分为七类,包括心血管、代谢、癌症、精神疾病、自身免疫病、传染病和儿科疾病。癌症样本主要来自U-CAN生物库,所有癌症患者均在诊断时和治疗开始前采样。研究还利用UK Biobank血浆蛋白质组项目(UKB-PPP)的数据对四种癌症的结果进行了验证。
研究首先通过纵向健康队列分析了5,348个蛋白质靶标,发现每个个体在所有访问中平均有2,014种蛋白质(38%)持续检测到 above the limit of detection (LOD),而2,676个靶标(50%)在任何访问中均未检测到。检测率分布显示两个 distinct peaks:一个对应高检测率的蛋白质,另一个对应低检测率的蛋白质。许多先前注释为“分泌到血液”的蛋白质被高度检测到,而许多高度可检测的蛋白质被注释为细胞内蛋白质。通过混合效应模型,研究发现随机效应(个体)解释的变异远大于固定效应(如年龄或性别)解释的变异,表明每个个体具有独特且稳定的血液蛋白质谱。
在儿童期到成年期的动态变化分析中,研究发现蛋白质组谱在青春期到成年期发生 dramatic shift。年龄和性别对蛋白质浓度 during development 有巨大影响。例如,CD33显示个体解释的方差最高,而ameloblastin(AMBN)受固定效应影响最大,其血液丰度在发育过程中迅速下降,与其在儿童期牙釉质形成中的已知作用一致。通过混合效应模型,研究总结了年龄对血浆蛋白质组谱的影响,许多蛋白质随年龄增长 abundance 显著降低或增加。性别依赖性差异 also 被探测,例如insulin-like 3(INSL3)、epididymal secretory protein E3-beta(EDDM3B)和serine peptidase inhibitor, Kunitz-type protease inhibitor 3(SPINT3)在男孩和女孩4岁和8岁时浓度相似,但在男性青春期显著增加。
作为研究的核心部分,研究人员收集了6,074个血浆样本,涵盖59种疾病,并补充了健康队列,使用Olink Explore平台分析了1,463种蛋白质。所有数据可在Human Protein Atlas的Disease Blood Resource中探索。研究结合了经典的差异丰度分析和机器学习方法,以识别跨疾病的 distinct protein profiles。
研究比较了传统的“病例-对照”发现方法和泛疾病方法。例如,fibroblast growth factor 1(FGF1)在胰腺癌患者中 compared to healthy controls 增加,但在细菌感染患者中也增加,导致其分类性能下降。carboxylesterase 3(CES3)在自身免疫疾病如类风湿关节炎(RA)和系统性红斑狼疮(SLE)中浓度增加,但在登革热患者中也 dramatically increased。glutathione S-transferase A3(GSTA3)在肝细胞癌中 compared to healthy controls 增加,但在慢性肝病中也增加。
通过方差分析(ANOVA),研究探讨了人口统计学因素和疾病状态对血浆蛋白质丰度的影响,发现疾病、年龄、性别和BMI可以解释 up to 77.5% 的蛋白质测量变异,疾病因素通常解释 most of the protein variation。例如,GDF15是疾病状态的标志物,ectodysplasin-A(EDA2R)与年龄密切相关,leptin(LEP)与BMI相关,glycoprotein hormones alpha chain(CGA)在女性中较高。
研究 further 探索了血浆蛋白质组数据在预测年龄、性别和BMI方面的潜力。通过机器学习方法,研究发现基于50种蛋白质的年龄模型可以准确预测 chronological age。蛋白质如CXCL17在整个生命过程中逐渐增加,而COL9A1在儿童期血液中浓度高,在青春期 dramatically decreased。模型在预测性别方面表现优异(AUC = 0.99),年龄预测R2 = 0.85,BMI预测R2 = 0.67。
在泛疾病队列分析中,研究发现 several diseases 显示出 distinct protein profiles,肝脏相关疾病、传染病和几种癌症之间存在相似性,反映了共享的免疫特征。儿科疾病和代谢疾病显示出 self-clustering properties。差异丰度分析揭示了疾病间共享的差异丰度蛋白质,尤其是在肝脏相关和传染病之间。富集分析显示,许多疾病共享 disrupted biological pathways,特别是围绕 immunity, metabolism, and cell regulation。
研究还验证了五种常见癌症( breast, ovarian, prostate, colorectal, and lung cancers)的血液蛋白质组谱,通过扩展患者队列和增加靶标覆盖至5,400多种蛋白质。分析 confirmed 许多在HDBA数据集中发现的蛋白质在扩展平台中也增加,例如PAEP在卵巢癌中增加。机器学习模型在区分癌症类型方面表现良好,肺癌、结直肠癌和卵巢癌的分类性能较强,而前列腺癌和乳腺癌的分类更具挑战性。
利用UK Biobank前瞻性队列,研究评估了癌症诊断前数年蛋白质组谱的预测潜力。结果对于肺癌最有前景,即使在诊断前数年AUC值 around 0.7,而卵巢癌仅在诊断时表现强劲,结直肠癌在诊断时性能 moderately higher,前列腺癌模型未显示预测性能。
研究结论表明,泛疾病方法能够系统比较主要人类疾病在一个统一蛋白质组数据集中的分子谱,提供了 scientific community 的资源。研究揭示了跨疾病的关键发现 regarding individual proteins and protein panels,并作为探索疾病特异性和共享血液蛋白质谱的工具,以 assist in clinical research。该资源有潜力作为研究基础,促进更聚焦的精准医学研究,推进对疾病机制的理解和识别潜在治疗靶点。
讨论部分指出,研究存在 several limitations,包括所有患者来自相对狭窄的人口区域,未来应扩展队列以包括更多样化人群。样本来自多个专用生物库,可能引入抽样偏差和变异性。尽管PEA高度敏感,但人类血液蛋白质组的极端动态范围可能导致一些蛋白质 below the detection sensitivity of the assay。依赖单一检测方法并不理想,应补充其他检测技术的数据。此外,许多疾病是复杂的而非单基因的,患者健康史和未诊断合并症的不确定性增加了异质性,可能影响结果的重要性和解释。尽管存在这些限制,该数据集作为 exploratory analyses 的资源, enabling hypothesis generation and guiding future studies toward validating and refining disease-specific protein signatures。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号