罕见非编码遗传变异与常见表型的关联探秘:解锁基因组 “暗物质” 的健康密码
【字体:
大
中
小
】
时间:2025年02月25日
来源:Nature Genetics 31.8
编辑推荐:
为探究罕见非编码遗传变异对常见表型的影响,埃克塞特大学研究人员分析英国生物样本库(UKB)数据,发现 604 个相关单变异及 357 个关联区域,为相关研究提供重要依据。
在生命的遗传密码中,非编码区域曾被视为 “垃圾 DNA”,但随着研究的深入,人们逐渐意识到这些区域蕴含着巨大的奥秘。非编码遗传变异在罕见严重疾病的发生中扮演着重要角色,比如某些非编码区域的变异可导致孤立性胰腺发育不全、先天性高胰岛素血症等。然而,它们在常见复杂性状中的作用却依旧迷雾重重。以往基于芯片的基因分型和全基因组关联研究(GWASs)虽然发现了数以万计与人类疾病相关的常见变异,但大多位于非编码区,且对于罕见变异的探索主要集中在编码区,对于非编码区罕见变异的研究困难重重。一方面,大规模研究缺乏全基因组测序(WGS)数据,另一方面,难以界定具有生物学意义的非编码调控基因组单位。这就好比在黑暗中摸索,我们知道前方有宝藏,却找不到通往宝藏的路。
为了揭开这层神秘的面纱,埃克塞特大学的研究人员踏上了探索之旅。他们以血浆蛋白质水平为切入点,利用 UKB 中约 50,000 名参与者的 WGS 数据,这些数据包含了 11 亿个变异和 1.23 亿个基于非编码聚合的测试,以及 2,907 种循环蛋白水平信息,开展了一项深入的研究。最终,他们的研究成果为我们理解罕见非编码遗传变异与常见表型之间的关系提供了重要线索,相关论文发表于Nature Genetics 。
在这场探索中,研究人员运用了多种关键技术方法。首先是 WGS 技术,利用 Illumina NovaSeq 6000 测序机器对 UKB 样本进行测序,平均覆盖度达 32.5×,并采用 GRCh38 基因组构建和 DRAGEN 3.7.8 进行变异检测。其次,通过 Olink 技术测定血浆中 2,932 种蛋白质的水平,并进行严格的质量控制。然后,对遗传数据进行一系列筛选和注释,包括设置基因型质量过滤标准、多等位基因拆分、变异注释分类等。最后,运用单变异和聚合关联分析方法,在考虑多种混杂因素的情况下,寻找与蛋白质水平相关的遗传变异,同时进行统计显著性评估和富集分析。
研究结果如下:
- 大量候选 pQTLs 的发现:研究人员对 2,891 种循环蛋白进行分析,共鉴定出 13,457 个统计上独立的顺式(cis)蛋白质定量性状位点(pQTL)关联,涉及 2,036 种蛋白质,其中部分蛋白质与多个独立 pQTL 相关,如 CD177 最多有 49 个。这表明遗传变异与蛋白质水平之间存在着复杂的关联网络。
- 数据质量问题的揭示:研究发现,部分蛋白质具有大量独立 pQTLs,可能是由于覆盖度低或基因表达受重复多态性拷贝数影响等原因导致的。为确保研究结果的可靠性,研究人员对数据进行了严格筛选,最终保留 1,026 种蛋白质用于后续分析。这一步骤就像是在沙中淘金,去除杂质,留下真正有价值的信息。
- 高质量罕见 pQTLs 的鉴定:经过筛选,研究人员鉴定出 1,651 个高质量的罕见 pQTLs,涉及 599 种蛋白质。这些罕见 pQTLs 在不同遗传背景人群中存在一定的相关性,且与之前研究结果有部分重叠,同时也展示了 WGS 在发现编码变异方面优于外显子测序的能力。
- 非编码 pQTLs 的特征分析:研究人员发现 604 个独立的罕见非编码单变异与 369 种蛋白质相关。非编码 pQTLs 在 5'-UTR 等区域富集,其效应大小与编码 pQTLs 有时相似,但对蛋白质水平的影响在增加和降低方面更为平衡,且很少受表位效应影响。这说明非编码区域的变异对蛋白质水平的调控有着独特的机制。
- 聚合测试的重要发现:通过聚合测试,研究人员鉴定出 357 个与循环蛋白水平相关的条件独立的罕见变异非编码区域。这些区域大多无法通过单变异分析检测到,且滑动窗口聚合测试能够发现一些新的关联区域,表明聚合测试在挖掘非编码区域遗传关联方面具有重要价值。
- 组织特异性富集的验证:研究发现,罕见非编码 pQTLs 在组织相关的非编码调控区域存在特异性富集,尤其是在分泌或信号蛋白相关的调控区域以及血管和肝脏的调控区域。这一结果揭示了非编码 pQTLs 与组织功能之间的紧密联系。
研究结论和讨论部分指出,本研究利用 WGS 数据成功发现了与常见表型相关的罕见非编码变异和聚合,展示了 WGS 在研究非编码区域遗传变异中的强大能力。然而,研究也存在一些局限性,如无法在独立数据集上进行验证、可能未完全排除混杂因素、仅测量了血液中的循环蛋白等。尽管如此,研究人员鉴定出的众多新关联为后续研究奠定了坚实基础。研究表明,5'-UTR 和预测的内含子剪接位点富含罕见非编码 pQTLs,凸显了 WGS 在发现新的罕见基因中心变异方面的重要性。同时,聚合测试在非编码区域的应用也为研究提供了新的视角,随着功能注释的完善和群体遗传数据的积累,有望发现更多与常见表型相关的非编码关联。这些发现为我们理解复杂性状的遗传机制提供了新的线索,也为未来的精准医学研究指明了方向,就像在黑暗中点亮了一盏明灯,照亮了我们探索遗传奥秘的道路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号