-
生物通官微
陪你抓住生命科技
跳动的脉搏
《PNAS》:人类基因数降到20500
【字体: 大 中 小 】 时间:2007年12月04日 来源:生物通
编辑推荐:
一项发表在近日的《PNAS》上的研究表明,人类基因组中编码蛋白质的基因数量要比最新估计的24500这个数字要少。
生物通报道:一项发表在近日的《PNAS》上的研究表明,人类基因组中编码蛋白质的基因数量要比最新估计的24500这个数字要少。
根据Broad研究所的这项研究显示,人类基因目录如Ensembl、RefSeq和Vega包括了许多开放阅读框,它们是任意出现的而不是蛋白质编码区域。这些发现将人类基因组中的蛋白质编码基因数目减少到了20500个。
Broad的研究队伍分析了ORF,并且没有证据显示人与小鼠或狗中存在进化保守性。据研究人员报道说,很多人都怀疑这些ORF中的一些是没有真正功能的,但是没有证据证实它们不是真正的基因。
因此,这篇PNAS文章指出,人类基因目录还需要进一步商榷。研究的负责人Clamp和同事发明了一种能够分析缺少种间对应部分的假定基因的特征。通过分析两者灵长类动物基因组上这些非保守性的ORF,研究人员发现它们既不是灵长类动物的基因创新的结果,也不是因为小鼠或狗的基因丢失导致。
这提供了强有力的证据证实,这些非保守ORF其实是虚构的,是应该从基因目录中清除掉的。
Broad研究组承认,他们的这项研究还存在局限性,可能影响最终的基因数量。例如,他们没有考虑位于在构建人类基因组时被忽略掉的区域中的197个假定基因。
另外,研究人员还在文章中解释说,他们研究的这些非保守性的ORF包括在目前的基因目录中。他们表示,尽管还可能发现其他的新蛋白质编码基因,但是最终的基因数量可能仍然会少于21000。
此前,来自康奈尔大学的研究人员通过利用超级计算机比较人类和其他哺乳动物基因组部分,发现了300个之前没有确定出的人类基因,并且还发现了几百个已知基因的范围。
这些发现是基于一种特殊的理论:当有机体进化时,对有机体有用的遗传密码部分以不同的方式发生变化。研究人员将这项研究的结果发表在近期网络版的《Genome Research》。
尽管目前已经确定出了超过20000个蛋白质编码基因,但康奈尔的这项发现证实,仍然有许多基因用目前的生物分析方法被漏掉了。这些方法对发现广泛表达的基因是非常有效的,但却会漏掉旨在特定器官表达或在胚胎发育早期表达的基因。
领导这项研究的Siepel和同事准备照出自阿进化上保守的基因,这些基因对所有生命都是至关重要的,并且其形式相同或非常相似。利用大规模的计算机组,研究人员运行了三种不同的程序来比较这些已由其他研究人员发现的存在于人类、小鼠、大鼠和小鸡的联合阵列。从构建和检测数学模型到最终运行程序的整个计划大约进行了3年。最终,他们发现了300个新的人类基因。(生物通雪花)