稀疏矩阵分解技术GLEANR揭示GWAS中样本共享干扰下的可解释遗传组分

【字体: 时间:2025年07月29日 来源:AJHG 9.8

编辑推荐:

  本研究针对GWAS(全基因组关联分析)中样本共享导致的假因子问题,开发了GLEANR(GWAS latent embeddings accounting for noise and regularization)算法。通过稀疏矩阵分解技术,研究人员在UK Biobank 137项GWAS中鉴定出58个遗传因子,揭示了血小板分化等生物学通路的特异性遗传架构。该方法显著提高了跨队列(UKBB-FinnGen)因子复现性,为解析复杂性状的共享遗传机制提供了新工具。

  

在解析复杂性状遗传基础的研究中,一个长期困扰科学界的难题是GWAS(全基因组关联分析)中普遍存在的多效性现象——单个基因变异往往影响多个看似不相关的性状。传统分析方法难以区分真实的生物学通路共享与因样本重叠导致的虚假关联,这严重阻碍了对遗传架构的准确解读。更棘手的是,现有矩阵分解方法产生的"密集因子"(dense factors)会同时加载于大多数性状和变异位点,使得结果难以对应到具体的生物学机制。

针对这一挑战,约翰霍普金斯大学(Johns Hopkins University)的Ashton R. Omdahl等研究人员在《美国人类遗传学杂志》(AJHG)发表重要成果。他们开发的GLEANR算法创新性地将样本共享协方差建模与稀疏正则化相结合,通过对UK Biobank(UKBB)137项GWAS数据的分析,不仅有效消除了样本重叠带来的干扰,更首次系统揭示了遗传因子与特定发育阶段生物学通路的对应关系。这项研究为理解复杂性状的遗传结构提供了全新视角,特别是对血液疾病的分子机制研究具有重要启示。

研究团队主要采用三大技术方法:1)基于交叉性状LD评分回归(XT-LDSR)估计样本共享相关矩阵C;2)双凸目标函数优化结合L1正则化实现稀疏分解;3)扩展贝叶斯信息准则(BIC)动态选择因子数量。分析使用的41,260个SNP来自UKBB欧洲人群137个性状(h2>0.05)的GWAS汇总统计数据,经LD剪裁(r2<0.2)处理。

GLEANR模型优势验证

通过模拟实验证明,当样本共享比例达25%时,传统SVD(奇异值分解)方法会产生3-5个假因子,而GLEANR即使在90%样本重叠下仍保持零假阳性。在UKBB-FinnGen跨队列分析中,GLEANR因子相关性(R2=0.62)显著高于未校正版本(0.59),证实其消除混杂效应的能力。

UKBB全表型组分析

应用GLEANR分解137个性状后,获得58个因子包含:1个加载所有性状的"泛在因子"(F1),27个"单性状因子",以及30个通路特异性因子。F1变异与平均遗传相关性高度关联(ρ=-0.80),其神经组织富集(胎儿脑q<10-8)提示中枢神经系统在跨性状遗传中的核心作用。

遗传架构多样性

因子间呈现显著的多基因性和选择压力差异:F1(多基因评分pk=0.92)呈现弱选择特征(Sk=-0.76),而皮肤色素相关因子F43(Sk=-1.17)显示强负选择信号。这种变异反映不同通路受到的选择压力存在本质区别。

血小板发育阶段解析

最引人注目的发现是三个血小板性状因子(F4/F11/F23)对应不同分化阶段:F23富集造血干细胞基因(THPO等),F11关联巨核细胞成熟,F4则反映血小板功能相关基因(如TPM4)。通过1,000次置换检验证实,这些因子分别与早期造血(q=0.048)、晚期巨核细胞分化(q=0.077)和血小板活化(q=0.048)阶段显著相关。

这项研究的突破性在于首次通过计算方法将GWAS信号分解为具有明确生物学意义的遗传组分。GLEANR的创新性体现在:1)通过建模样本共享协方差矩阵C,解决了长期存在的假因子问题;2)稀疏约束产生可解释的因子结构,较传统SVD方法解释性提升5倍;3)揭示血小板性状的遗传效应分层对应发育生物学已知阶段,为复杂性状的"遗传解剖"提供范式。

特别值得注意的是,该方法仅需GWAS汇总统计数据即可实施,使得现有大规模生物库数据得以重新挖掘。研究者提供的开源软件包(https://github.com/aomdahl/gleanr)将推动该技术在精神疾病、代谢综合征等多基因性状研究中的应用,为精准医学提供新的分析工具。正如作者强调的,这种"遗传结构显微镜"般的分析能力,将从根本上改变我们理解复杂疾病共享遗传基础的视角。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号