
-
生物通官微
陪你抓住生命科技
跳动的脉搏
上海生科院《Genome Res》生物信息学新成果
【字体: 大 中 小 】 时间:2015年10月16日 来源:生物通
编辑推荐:
十月十三日,国际基因组研究权威刊物《Genome Research》在线发表了中国科学院上海生命科学研究院计算生物学研究所(中国科学院—马普学会计算生物学伙伴研究所)的一项最新研究。该研究介绍了一种新的群体遗传学数据分析方法,这种概率统计方法可用于检测和估算群体间的选择差异。
生物通报道:十月十三日,国际基因组研究权威刊物《Genome Research》在线发表了中国科学院上海生命科学研究院计算生物学研究所(中国科学院—马普学会计算生物学伙伴研究所)的一项最新研究,题为“A probabilistic method for testing and estimating selection differences between populations”。该研究介绍了一种新的群体遗传学数据分析方法,这种概率统计方法可用于检测和估算群体间的选择差异。延伸阅读:序列分析/生物信息学的十个手机应用程序。
本文第一作者兼通讯作者是中科院—马普学会计算生物学伙伴研究所的何云刚研究员,他主要从事人类群体遗传学和计算基因组学研究,并着重于基因组多态性的群体遗传学, 计算基因组学和疾病研究中的计算生物学问题。部分相关工作发表在PNAS、Cell Research等杂志。中科院院士、教育部****讲座教授、国家“****”金力也是本文共同作者,另外,计算所的徐书华研究员也参与了此项工作。
世界各地的人类种群遇到各种各样的环境挑战,并因此对不同的选择力量发展出了遗传适应性。确定种群间自然选择的差异,对于理解特定遗传变异在进化适应性中的作用,是至关重要的。虽然科学家们已经开发了许多方法,来检测经受最近定向选择的遗传位点,但是仍然缺乏一种概率统计学的解决方法,来检测和量化种群之间的选择差异。
在这项研究中,研究人员报道了一种概率统计学方法,用于检测和估算种群间的选择差异。利用一个遗传漂变和选择的概率模型,研究人员发现,等位基因频率的对数比值比,可估测种群间选择系数的差异。估计值近似于一个正态分布,方差可以使用全基因组变异进行估算。这使我们能够量化选择系数的差异,并确定估计值的置信区间。
这项研究工作还揭示了遗传关联性检验和选择差异假设检验之间的联系。因此,它为选择差异的假设检验,提供了一个解决方案。这种方法已被应用到汉族和藏族人群的全基因组数据分析。结果证实,在汉族和藏族人群中,EPAS1和EGLN1基因受到统计学差异的选择。
研究人员进一步估算了黑色素形成相关遗传变异的选择系数的差异,并确定了它们在欧洲群组之间的置信区间。将这种方法应用于实验数据,表现出了这种新方法用于检测和量化自然选择差异的卓越能力。
(生物通:王英)
生物通推荐原文摘要:
A probabilistic method for testing and estimating selection differences between populations
Abstract: Human populations around the world encounter various environmental challenges, and consequently develop genetic adaptations to different selection forces. Identifying the differences in natural selection between populations is critical for understanding the roles of specific genetic variants in evolutionary adaptation. Although numerous methods have been developed to detect genetic loci under recent directional selection, a probabilistic solution for testing and quantifying selection differences between populations is lacking. Here we report the development of a probabilistic method for testing and estimating selection differences between populations. Using a probabilistic model of genetic drift and selection, we showed that logarithm odds ratios of allele frequencies provide estimates of the differences in selection coefficients between populations. The estimates approximate a normal distribution and variance can be estimated using genome-wide variants. This allows us to quantify differences in selection coefficients and to determine the confidence intervals of the estimate. Our work also revealed the link between genetic association testing and hypothesis testing of selection differences. It therefore supplies a solution for hypothesis testing of selection differences. This method was applied to a genome-wide data analysis of Han and Tibetan populations. The results confirmed that both EPAS1 and EGLN1 genes are under statistically different selection in Han and Tibetan populations. We further estimated differences in the selection coefficients for genetic variants involved in melanin formation and determined their confidence intervals between continental population groups. Application of the method to empirical data demonstrated the outstanding capability of this novel approach for testing and quantifying differences in natural selection.
生物通微信公众号
知名企业招聘