罕见非编码遗传变异与常见表型的关联探秘:解锁基因组 “暗物质” 的健康密码

【字体: 时间:2025年02月25日 来源:Nature Genetics 31.8

编辑推荐:

  为探究罕见非编码遗传变异对常见表型的影响,埃克塞特大学研究人员分析英国生物样本库(UKB)数据,发现 604 个相关单变异及 357 个关联区域,为相关研究提供重要依据。

  在生命的遗传密码中,非编码区域曾被视为 “垃圾 DNA”,但随着研究的深入,人们逐渐意识到这些区域蕴含着巨大的奥秘。非编码遗传变异在罕见严重疾病的发生中扮演着重要角色,比如某些非编码区域的变异可导致孤立性胰腺发育不全、先天性高胰岛素血症等。然而,它们在常见复杂性状中的作用却依旧迷雾重重。以往基于芯片的基因分型和全基因组关联研究(GWASs)虽然发现了数以万计与人类疾病相关的常见变异,但大多位于非编码区,且对于罕见变异的探索主要集中在编码区,对于非编码区罕见变异的研究困难重重。一方面,大规模研究缺乏全基因组测序(WGS)数据,另一方面,难以界定具有生物学意义的非编码调控基因组单位。这就好比在黑暗中摸索,我们知道前方有宝藏,却找不到通往宝藏的路。

为了揭开这层神秘的面纱,埃克塞特大学的研究人员踏上了探索之旅。他们以血浆蛋白质水平为切入点,利用 UKB 中约 50,000 名参与者的 WGS 数据,这些数据包含了 11 亿个变异和 1.23 亿个基于非编码聚合的测试,以及 2,907 种循环蛋白水平信息,开展了一项深入的研究。最终,他们的研究成果为我们理解罕见非编码遗传变异与常见表型之间的关系提供了重要线索,相关论文发表于Nature Genetics

在这场探索中,研究人员运用了多种关键技术方法。首先是 WGS 技术,利用 Illumina NovaSeq 6000 测序机器对 UKB 样本进行测序,平均覆盖度达 32.5×,并采用 GRCh38 基因组构建和 DRAGEN 3.7.8 进行变异检测。其次,通过 Olink 技术测定血浆中 2,932 种蛋白质的水平,并进行严格的质量控制。然后,对遗传数据进行一系列筛选和注释,包括设置基因型质量过滤标准、多等位基因拆分、变异注释分类等。最后,运用单变异和聚合关联分析方法,在考虑多种混杂因素的情况下,寻找与蛋白质水平相关的遗传变异,同时进行统计显著性评估和富集分析。

研究结果如下:


研究结论和讨论部分指出,本研究利用 WGS 数据成功发现了与常见表型相关的罕见非编码变异和聚合,展示了 WGS 在研究非编码区域遗传变异中的强大能力。然而,研究也存在一些局限性,如无法在独立数据集上进行验证、可能未完全排除混杂因素、仅测量了血液中的循环蛋白等。尽管如此,研究人员鉴定出的众多新关联为后续研究奠定了坚实基础。研究表明,5'-UTR 和预测的内含子剪接位点富含罕见非编码 pQTLs,凸显了 WGS 在发现新的罕见基因中心变异方面的重要性。同时,聚合测试在非编码区域的应用也为研究提供了新的视角,随着功能注释的完善和群体遗传数据的积累,有望发现更多与常见表型相关的非编码关联。这些发现为我们理解复杂性状的遗传机制提供了新的线索,也为未来的精准医学研究指明了方向,就像在黑暗中点亮了一盏明灯,照亮了我们探索遗传奥秘的道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号