编辑推荐:
为了深入了解各种人类疾病的生物学以及治疗发展的潜在线索,Pietzner等.进行了详细的全基因组蛋白质基因组图谱绘制。
基因与疾病的关系
许多疾病至少有一部分是由于遗传原因造成的,而这些原因并不总是能够被理解或针对特定的治疗方法。为了深入了解各种人类疾病的生物学以及治疗发展的潜在线索,Pietzner等.进行了详细的全基因组蛋白质基因组图谱绘制。作者分析了潜在的疾病相关突变、特定蛋白质和医疗条件之间的数千种联系,从而为未来的研究人员提供了一个详细的地图。
简介
理论基础
广泛捕获蛋白质组学通过系统地整合蛋白质编码基因之间共享的遗传信号、由此产生的蛋白质丰度或功能以及常见复杂疾病的知识,有可能识别致病基因、机制和候选药物靶点。虽然技术进步现在使这种研究在规模上成为可能,但大多数蛋白质的遗传结构及其与人类健康的相关性仍然是未知的。我们进行了一项全基因组蛋白质组关联研究,包括10708名欧洲后裔(平均年龄48.6岁,53.3%女性)血浆中4775个蛋白质靶点。我们利用已鉴定的蛋白质-数量性状基因座(pqtl)创建了一个人类健康的蛋白质基因组图谱,该图谱基于在蛋白质编码位点(cis pQTLs)上对数千个表型进行测试的共享、共域遗传结构。
结果
我们确定了10674个基因变异-蛋白质靶向关联(P<1.004×10–11个)分布于2548个基因组区域(1097个未报告),覆盖3892个不同的蛋白质靶点。在1538个含有至少一个顺式pQTL的蛋白质靶点中,我们发现在49个组织中至少有一个组织中有一半与基因表达共享基因信号;选择性剪接事件约占其中的五分之一,证明了血浆蛋白质组学作为推断组织效应的手段的效用。我们证明了cis-pqtl有助于在558个已建立的537个对照表型的危险位点上对候选致病基因进行优先排序。其中四分之一(24.6%)的基因包括未报告或与基因表达qtl排序不同的基因,包括PRSS8(编码前列腺素)用于老年痴呆症或RSPO1(编码R-spondin-1)用于子宫内膜癌。我们建立了一个顺式锚定的人类健康蛋白质基因组图谱,包括1859个基因-蛋白质表型连接,包括412个蛋白质和506个调控性状。这张地图突出了交叉疾病的生物学融合。例如,遗传信号EFEMP1型细胞外纤维样结缔组织形态异常(1)与含EGF的纤维样结缔组织形态一致Efemp1型击倒老鼠。整合不同的“组分”层确定过饱和胆汁促进胆固醇结晶和胆石形成是苏丹2A1.我们开发了一种结合本体映射和数据衍生蛋白质网络的pqtl分类方法。这表明39%(n=2302)的反式pqtl(即远离蛋白编码基因的pqtl)是蛋白质或途径特异性的,并确定了已建立的风险位点,如rs738409(PNPLA3),一个已建立的肝纤维化位点,作用于几个蛋白质,这些蛋白质都是一个特定的蛋白质群落的一部分。我们开发了一个交互式网络资源(www.omicscience.org/apps/pgwas)以便于快速获取和审问我们的结果。
结论
基因锚定血浆蛋白质组学识别疾病的共同病因,实现药物靶点的优先化,并为基因-表型和蛋白质-表型连接提供系统生物学背景。
蛋白质的遗传调控特性对于理解疾病的病因和开发治疗方法至关重要。我们为3892个血浆蛋白鉴定出10674个基因关联,从而创建了一个1859个连接的顺式锚定基因-蛋白质疾病图谱,突出了强烈的交叉疾病生物学收敛性。这个蛋白质-基因组图谱提供了一个框架来连接病因学相关的疾病,为新的或正在出现的疾病提供生物学背景,并整合不同的生物学领域以建立已知基因-疾病联系的机制。我们的研究结果确定了疾病内部和之间的蛋白质-基因组联系,并确定了顺式蛋白变体在全基因组关联研究中确定的位点上注释可能的致病基因的价值,从而解决了遗传发现的实验验证和临床翻译的主要障碍。