Nature Genetics:人类基因组短串联重复序列预测

【字体: 时间:2017年09月13日 来源:生物通

编辑推荐:

  加州大学圣地亚哥分校(UCSD)生物信息学的一队研究人员联合纽约基因组中心、哈佛大学和麻省理工学院共同开发了一种可分析人类基因组中短串联重复序列(short tandem repeats,STR)或称为微卫星(microsatellites)突变的工具。最新文章发表在9月12日出版的《Nature Genetics》。

  

生物通报道:

STR在研究DNA多态性标记过程中被发现,表现形式为1~6个核苷酸不断重复,有时多达数百或数千次。已知这些突变与大约30种人类状况有关,最著名的是亨廷顿氏病(又称亨廷顿舞蹈症),患者体内有超过40份拷贝的特定重复,拷贝数越多,越容易受疾病影响,病情越严重。

数十年来,《Nature Genetics》杂志一直跟踪报道人类基因组有害突变,串联重复序列往往是被忽视的一群,有时还被错认为“垃圾DNA”。以UCSD助理教授Melissa Gymrek为首的一些研究人员认为,串联重复序列可能是破解许多人类健康问题的关键,需要深入研究。

“当在人类基因组中寻找疾病信号时,一眼望过去,可选答案浩若繁星。我们正在寻找一种有效的方式来缩小答题范围,”同时在医学院和工程学院任职的Gymrek说。

分析重复序列

串联重复序列往往很长,因此很难用普通的只能查看短片段的基因组测序技术进行分析。而且,一般DNA扩增也会造成更多错误。索取PacBio长读取测序技术的详细技术资料,请填写表格

在本文中,研究人员详细描述了他们所构建的数学模型,以此来预测人类基因组中重复序列的出现和突变频率。他们从300个独立个体基因组中获取了超过150万个重复序列。

在他们早期开发的能精确估计Y染色体中串联重复序列的MUTEA算法基础上,经改进后,这款新算法可用于分析成对的DNA变异(haplotypes,单倍型)。采用新算法分析后,研究人员发现,不同种类的突变不仅有规律可循,而且间隔时间可被预测,因此他们构建了所谓的“分子钟”。利用分子钟,可确定突变在基因组内的突变频率。

寻找约束(constraint)

接下来,研究人员使用模型计算实际突变率,并与预期突变率进行比较。基因组中在生命早期产生严重健康状况的突变往往比预期的突变少,遗传学家将这种情况定义为高度被约束的。例如,患有自闭症的人不太可能会将他们的基因遗传给下一代。相反,例如亨廷顿氏病等导致生命后期发病的突变很可能会传给孩子,通常不受约束。长读长测序揭秘基因组中被遗忘的角落

研究人员对一些早发型和晚发型疾病的重复序列套用了他们的模型。该模型正确地鉴定出了受约束的与早发条件有关的重复序列。

此外,他们还利用这个方法分析了一组非疾病相关重复序列,结果与预期一致,这些重复序列按照预期的速率发生变化并且不受约束。

接下来研究人员计划,用这款最新工具重新检查孤独症患者的家族基因组。

人类基因组还未完整测序,新机遇在等你!

原文标题:Interpreting short tandem repeat variations in humans using mutational constraint

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号