12111种影响人类身高的SNP 来自迄今最大规模540万个体全基因组关联研究

【字体: 时间:2022年10月15日 来源:broad institute

编辑推荐:

  迄今为止最大规模的540万个体GWAS研究,研究人员确定了包含超过12111种影响身高的SNP变异图谱。

  

“高富帅”之所以令人向往,大约是由于这三个字简单粗暴地概括了对体格优势、生存资源和审美的本能追求。“高”是其中相对最简单的——成年人身高易于测量且不受个人评判因素干扰、在很大程度上与遗传有关,受其他因素影响相对较小,这使得身高成为一种遗传学家可用于评估“常见遗传变异在决定人类多基因表型的遗传和生物学结构中发挥什么作用”的模式特征。但是,即使是20年前开始研究身高的遗传学家也不确定他们是否能够找到影响这一特征的常见遗传因素。

Joel Hirschhorn作为波士顿儿童医院的儿科内分泌学研究员,曾看到许多儿童被他们的儿科医生认定是异常矮小的身材。他经常告诉父母,他们的孩子生长缓慢是因为孩子遗传了基因,尽管科学家估计80%的身高变化是由基因造成的,但他们不知道这些基因是什么。“在第20个病人之后,我想,‘嘿,我工作的地方可以解决这个问题,’”作为Broad研究所的博士后研究员,Hirschhorn当时决定研究身高,尽管所有人都告诉他,身高是多基因表型——涉及的基因太多,无法找到它们。Hirschhorn没有被吓倒,他转向全基因组关联研究(GWAS)——科学家扫描一个群体的整个基因组,以确定遗传变异和性状之间的联系。在接下来的20年里,GIANT联盟在近 700,000 人样本量的GWAS数据库中报告了 712 个位点中多达 3,290 个与身高关联的SNP变异,但由于研究主要针对欧洲血统参与者,多样性的缺乏是遗传研究中一个普遍问题。

来自Broad研究所和GIANT联盟的研究人员与23andMe一起,收集了来自不同血统的 将近540 万个体的全基因组关联研究的数据——比之前的研究多6倍有多,其中包含>408万欧洲血统参与者(EUR,占总样本的 75.8%);>47万 东亚血统参与者(EAS,8.8%);>45万具有典型混血血统的西班牙裔参与者 (HIS,8.5%);>29万具非洲和欧洲血统的非裔美国人(AFR,5.5%);接近8万名南亚血统参与者(SAS,1.4%)。他们使用 HapMap 3 项目 (HM3) 中编目的SNP变异,绘制与成人身高的常见遗传关联,并评估该图谱在变异体、基因组区域和可能的情况下的饱和度。分析结果确认了12111个常见的与身高有关的单核苷酸多态性(SNPs),几乎可解释所有常见的基于 SNP 的身高关联遗传因素。这些 SNP 聚集在 7,209 个非重叠基因座片段中,平均大小约为 90 kb,覆盖约 21% 的基因组。独立关联的SNP密度在整个基因组中有所不同,密度高的区域富含生物学相关基因——就是说:这 12,111 个 GWS SNP 非随机聚集在彼此附近和已知骨骼生长基因附近。这12,111 个 SNP(或 HapMap 3 panel 2中的所有 SNP) 占欧洲血统人群身高表型变异的 40% (45%),但在其他血统人群中仅占 10-20% (14-24%) 左右。这是迄今为止规模最大的同类研究,总体而言,研究提供了包含绝大多数常见身高相关SNP变异的特定基因组区域的综合图谱。

这张图谱对于欧洲血统的人群来说已经饱和,但需要进一步研究才能在其他血统中实现同等的饱和度。虽然到目前为止已知在不同的群体中影响身高的基因组区域是相同的,但包括更多的非欧洲血统的个体样本将对提高预测的准确性至关重要,并有助于识别特定群体的遗传变异。“这项研究涵盖了广泛的人类祖先,是迄今为止最大的GWAS,但我们再次发现,进一步涉及不同祖先是必要的,”通讯作者之一、大阪大学医学院和东京大学的教授、日本理研综合医学中心的团队负责人Yukinori Okada说。

这些SNP可以帮助研究人员开发用于临床的身高预测工具。儿科医生目前根据孩子的家族史来预测他们的身高,但这些估计并不完美——例如不能预测一对兄弟姐妹的身高不同。基于SNP的预测可能更准确。如果医生注意到孩子的身高与预测不符,这可能是一个线索,可以检测孩子是否患有影响生长的罕见隐藏疾病,如乳糜泻和激素缺乏。

通过研究500多万人的DNA,这些遗传学家团队完成了多年前他们认为不可能完成的事情。“我们觉得这真的是一个里程碑,”该研究的资深作者、布罗德研究所成员Joel Hirschhorn说,他也是波士顿儿童医院和哈佛医学院的遗传学教授和儿科教授。“我们现在基本上已经完成了将这种遗传影响因素映射到特定基因组区域的工作,这强调了增加样本量可以告诉我们哪些性状是由多个基因控制的。”发表在《自然》(Nature)杂志上的研究结果有一天可以帮助医生识别那些没有达到基因预测身高、可能患有影响其生长和健康的隐藏疾病或缺陷的人。研究结果还说明了全基因组关联研究(GWAS)在揭示疾病的生物学基础以及在更大的研究中揭示疾病遗传力方面的力量。

“在2010年,我们预测我们应该能够解释40%的个体身高差异,但我们没有想到这需要500万人涉及1.2万个DNA突变,而且实现得如此之快,”该研究的资深合著者、昆士兰大学定量遗传学教授兼主席Peter Visscher说。“当GWAS与非常大的样本数量相结合时,是一个令人惊讶的强大的实验设计。”

作为最大的GWAS,这项研究也为科学家们如何从基因组中学习提供了见解。将参与者加入GWAS使其成为一个更可靠、更强大的工具,但科学家不知道是否有一个临界点可以使研究“饱和”——即当额外的数据不能提供任何新的见解时被认为达到“饱和”。GIANT的研究人员发现,他们确定的SNP最终解释了超过90%的基于SNP的变异,这表明了一个饱和点。他们还发现,与找到精确的基因组区域相比,识别与身高相关的生物通路的大致轮廓所需的样本量更少。

澳大利亚昆士兰大学分子生物科学研究所统计基因组学实验室主任Loic Yengo是该研究的第一作者和通讯作者,他说:“我们已经能够使用经验数据,而不是以前使用的理论模型,来解决GWAS研究中长期存在的问题。”

遗传学家还想知道,随着GWAS的增大,它所揭示的SNP是否会分布在越来越多的基因组上。GIANT的研究结果显示,影响身高的SNP聚集在基因组的20%以上的区域,特别是靠近先前与骨骼生长障碍相关的基因——例如,25个SNP聚集在ACAN基因附近,这种基因在身材矮小和骨骼发育不良的患者中会发生突变。一些SNPs也暗示了影响骨骼生长板的信号通路,骨骼生长板是长骨末端附近的软骨,随着儿童的成长,它会扩展和硬化成固体骨。

研究人员认为,这种遗传变异的聚类可能适用于其他性状,并可能为其他常见疾病的研究提供信息,如受多个基因影响的高血压或哮喘。现在他们知道了哪些基因组区域影响身高,GIANT团队也可以开始使用精细绘图方法追踪个体变异是如何影响身高的。更罕见和更复杂的变异可能解释了SNP无法解释的遗传力,也将成为未来研究的目标。

研究人员也讨论了研究的局限性。例如,该研究专注于来自 HM3 panel 的 SNP,它仅代表部分常见遗传变异。HM3 SNP panel 以外的SNP也可能与身高相关。不过,额外信息(也称为“隐藏的遗传力”)仍然很可能集中在基于 HM3-SNP 的 GWS 基因座内,这一结果强调了身高相关基因座普遍存在的等位基因异质性。研究的另一个限制是超过75%的个体来自欧洲血统,未能解决如何在多血统研究中识别条件独立关联;无法对特定于人群的遗传关联进行有效的复制分析。与所有 GWAS 一样,效应基因的明确鉴定以及基因和变异影响表型的机制仍然是一个关键瓶颈。也许,通过结合越来越大的全外显子组测序研究,可以实现从 GWAS 中识别身高因果基因的突破进展,从而实现直接的 SNP 到基因定位。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:身高|SNP|GWAS|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号