基于深度学习的血浆蛋白质组复杂遗传效应解析:揭示ABO位点优势效应与基因互作新机制

《Nature Communications》:Complex genetic effects linked to plasma protein abundance in the UK Biobank

【字体: 时间:2025年12月15日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对传统GWAS线性模型难以捕捉复杂遗传效应的问题,开发了深度学习框架EIR-auto-GP,系统分析UK Biobank中48,594个体的2,922种血浆蛋白质。研究发现15种蛋白质受遗传优势效应和上位性调控,首次揭示ABO与FUT3基因座互作调控肠道蛋白FAM3D的分子机制,为V2F研究提供了新范式。

  
在人类遗传学研究领域,基因组关联分析(GWAS)已成功鉴定数千个与复杂性状相关的遗传变异。然而,这些变异如何通过分子机制影响表型,即"变异到功能"(V2F)的转化过程,仍是现代遗传学的核心挑战。传统GWAS多采用线性加性模型,但越来越多的证据表明,非加性遗传效应(如优势效应和上位效应)以及基因-环境互作可能在复杂性状形成中发挥关键作用。
为系统解析这些复杂效应,由哥本哈根大学Arnor I. Sigurdsson和Justus F. Graf作为共同第一作者的研究团队,在《Nature Communications》发表了最新研究成果。研究团队开发了名为EIR-auto-GP的深度学习自动化流程,对英国生物样本库(UK Biobank)中48,594名个体的2,922种血浆蛋白质进行大规模分析。研究不仅验证了已知的蛋白质数量性状基因座(pQTL),还新发现123种蛋白质受非线性协变量效应调控,15种蛋白质受遗传优势效应和上位效应影响,特别是揭示了ABO血型基因座与FUT3基因的新互作机制。
关键技术方法包括:基于EIR深度学习框架开发自动化建模流程EIR-auto-GP;采用UK Biobank Pharma Proteomics Project(UKB-PPP)队列的Olink蛋白质组数据(n=48,594);通过FinnGen队列(n=1,757)和HOLBAEK肥胖儿童队列的质谱蛋白质组数据(n=1,924)进行验证;运用普通最小二乘法(OLS)进行基因互作检测和精细定位分析。
建模血浆蛋白质水平的深度学习框架
研究团队首先对UK Biobank基因型数据进行质控,获得424,097个高质量单核苷酸变异(SNV)。通过蛋白质特异性GWAS预筛选输入变异(p<0.001),大多数深度学习模型训练使用的变异数控制在1,000个以内。采用EIR-auto-GP框架训练深度学习模型时,除了基因型数据,还整合了年龄、性别、UKB中心等协变量。结果显示深度学习模型预测性能(R2中位数0.04)显著优于线性模型(0.03),其中171种蛋白质存在显著性能差异。
非线性效应与血浆蛋白质丰度的关联
为区分真实生物效应与技术偏差,研究对比了归一化蛋白表达值(NPX)和逆秩正态转换(INT)数据建模结果。138种蛋白质在INT转换后仍保持显著性能差距,表明深度学习模型捕获的非线性效应具有生物学基础。进一步分解显示,123种蛋白质的性能差异主要源于协变量非线性效应(如FSHB中年龄与性别的交互),而其余15种则可能受遗传因素驱动。
ABO基因座优势效应调控CD209和CLEC4M水平
通过比较加性与非加性编码基因型的模型性能,研究发现ABO基因座变异rs505922对C型凝集素家族蛋白CD209和CLEC4M存在显著优势效应。精细定位确定rs505922为最可能的因果变异,其基因型与ABO血型分型一致。线性模型中加入该变异的一热编码后,预测性能提升9.21%,证实了优势效应的贡献。
基因变异间非线性互作影响蛋白质水平
针对15种潜在非线性遗传效应蛋白质,研究通过OLS模型检测到784个跨染色体SNV-SNV互作,其中96%集中于9号染色体ABO基因座和19号染色体FUT2基因座。特别发现rs507666(ABO)与rs2307019(IZUMO1/FUT2)的互作可解释ALPI、MUC2等肠道蛋白4.5%-5.3%的性能差异。此外,首次报道ABO与FUT3基因座新型互作调控FAM3D蛋白水平,拓展了胃肠道蛋白调控网络。
跨族群与技术平台的验证
模型在非英国白人族群中的泛化性分析显示,性能转移存在异质性,凸显跨族群建模的必要性。在FinnGen队列中成功复制了ABO优势效应(CD209/CLEC4M)和ABO-FUT2互作(ALPI/MUC2)。即使在样本量较小的HOLBAEK肥胖儿童质谱蛋白质组数据中,也验证了6种蛋白质的非线性协变量效应,证明方法的多平台适用性。
本研究通过深度学习系统揭示了血浆蛋白质组的复杂遗传架构,突破传统线性模型的局限。发现的ABO-FUT3新互作机制为胃肠道疾病研究提供新视角,而EIR-auto-GP工具包将推动复杂性状的V2F研究。随着多组学队列规模的扩大,深度学习有望在精准医疗和药物靶点发现中发挥更大价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号