循环蛋白质组遗传调控图谱揭示疾病特异性pQTL与因果蛋白,助力精准风险预测
《Nature Communications》:Genetic profiling of the circulating proteome in common diseases suggests causal proteins and improves risk prediction
【字体:
大
中
小
】
时间:2025年12月13日
来源:Nature Communications 15.7
编辑推荐:
为解决GWAS风险变异功能解析难题,研究人员开展大规模疾病分层pQTL研究,系统绘制42种疾病中2,901种血浆蛋白的遗传调控图谱,鉴定1,806个疾病相关pQTL和110个高置信度因果蛋白,并构建融合多基因风险评分(PRS)与蛋白风险评分(ProRS)的预测模型,为疾病机制解析和精准防控提供新范式。
随着全基因组关联研究(GWAS)发现大量疾病相关遗传变异,如何将这些变异转化为致病机制和治疗靶点成为当前生物医学研究的核心挑战。蛋白质作为生命功能的直接执行者,在疾病发生发展中扮演关键角色。近年来,蛋白质定量性状位点(pQTL)研究通过连接遗传变异与蛋白质表达水平,为解读GWAS发现提供了新视角。然而,现有大规模pQTL研究多在健康人群或混合人群中进行,忽视了疾病状态对蛋白质遗传调控的特异性影响。病理状态下,蛋白质的调控网络可能发生显著改变,这种疾病特异性的遗传调控机制亟待系统解析。
为解决这一科学问题,武汉大学田剑波教授团队联合多个研究机构在《Nature Communications》上发表了最新研究成果。研究团队利用英国生物样本库(UK Biobank)中35,690名参与者(包括7,626名健康个体和28,064名42种疾病患者)的遗传和蛋白质组数据,开展了迄今为止最全面的疾病分层pQTL分析。研究采用Olink Explore 3072邻位延伸分析技术检测2,901种血浆蛋白,通过线性回归模型鉴定pQTL,并运用条件分析确定独立信号。此外,研究还整合了孟德尔随机化分析、生存分析、药物-基因相互作用分析等多种计算方法,系统探索了蛋白质与疾病间的因果关系及临床转化价值。
研究人员首先在42种疾病和健康人群中系统鉴定pQTL,共发现25,987个独立pQTL关联,涉及2,224个独立遗传区域和1,856种蛋白质。其中59.24%为顺式作用(cis-pQTL),40.76%为反式作用(trans-pQTL)。令人瞩目的是,73.11%的主要关联能在既往研究中得到验证,证实了结果的可靠性。与健康人群相比,疾病特异性pQTL在疾病GWAS位点中显著富集,提示这些变异更可能参与疾病发生。
通过功能注释发现,pQTL显著富集于错义突变区、转录因子结合位点和组蛋白修饰标记区,表明其可能通过影响转录调控和翻译过程调节蛋白质水平。顺式pQTL对蛋白质浓度变异的解释度(13.50%)显著高于反式pQTL(1.81%),且效应强度与次要等位基因频率呈负相关。进一步将pQTL分为蛋白质特异性、通路特异性和非特异性三类,发现平均83.14%的关联为蛋白质特异性,揭示了蛋白质遗传调控的多样性。
通过共定位分析,研究人员发现34.68%的蛋白质与其对应基因表达共享遗传信号,12.29%与选择性剪接相关,表明pQTL可通过调控基因表达和剪接影响蛋白质丰度。更重要的是,pQTL在大多数疾病GWAS位点中显著富集,平均可解释约6.8%的疾病遗传力,其中2型糖尿病、乳腺癌等疾病超过20%。共定位分析还识别出平均每种疾病有5种蛋白质与疾病风险共享遗传决定因素,如载脂蛋白(a)(LPA)与冠心病等心血管疾病的关联,揭示了疾病间共享的遗传基础。
研究首次系统比较了健康与疾病状态下pQTL调控模式的差异。通过线性混合效应模型,鉴定出1,806个疾病相关pQTL和7,924个疾病偏向性pQTL。这些疾病相关pQTL具有更大的效应规模,且显著富集于错义突变区。例如,rs77779567-CDCP1对在主要不良心血管事件患者中显示增强的调控效应,CDCP1已知参与心脏纤维化过程。跨疾病比较还发现2,832个pQTL关联存在显著差异,如rs62217915-KIT在哮喘患者中的效应强于鼻炎患者,提示肥大细胞调控在哮喘中的特异性作用。
基于pQTL谱的层次聚类将27种疾病分为8个簇,既包含了已知的临床关联(如白内障和青光眼同属眼科疾病簇),也揭示了意想不到的生物学联系。例如,簇7包含呼吸系统、消化系统和神经系统疾病,通路富集分析显示免疫炎症是连接这些看似不相关疾病的共同主线。跨疾病热点区域(如chr8_77区域与9种蛋白质的反式关联)进一步揭示了心血管、代谢和免疫失调的互作网络。
通过整合45,188人的队列研究和孟德尔随机化分析,研究人员确立了蛋白质与疾病间的因果关联。队列研究识别出25,940个显著关联,涉及2,663种蛋白质和32种疾病终点。孟德尔随机化分析则发现639个显著的因果关联,其中68.37%使用健康人群pQTL作为工具变量时仍保持显著。最终,110个蛋白质-疾病关联被确认为高置信度因果关联,包括脂蛋白(a)与多种心血管疾病、PCSK9与脂代谢障碍等的已知关联,以及SCGB1A1与哮喘、ACE与2型糖尿病等新发现关联。
研究进一步构建了pQTL衍生的多基因风险评分(PRS)和因果蛋白衍生的蛋白风险评分(ProRS)。结果显示,PRS+ProRS联合模型对21种疾病的风险分层效能显著优于单一模型,C指数最高提升0.17(2型糖尿病)。决策曲线分析证实联合模型具有最高的临床效用,凸显了蛋白质组与基因组数据整合在精准医疗中的应用潜力。
为促进科研成果共享,团队开发了"pQTL-Atlas"数据库,提供pQTL、生存pQTL、因果蛋白等六大功能模块,支持可视化查询和数据分析,为疾病机制研究和靶点发现提供重要资源。
这项研究通过大规模疾病分层pQTL分析,深刻揭示了疾病状态如何重塑蛋白质的遗传调控网络,确立了蛋白质在疾病发生中的因果作用,并证明了多组学数据整合在风险预测中的突出价值。研究成果不仅为理解疾病分子机制提供新视角,也为精准预防、靶点发现和药物重定位奠定坚实基础。随着蛋白质组学技术的不断进步和人群队列的扩大,蛋白质遗传学研究必将在精准医疗时代发挥越来越重要的作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号