
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于数学约束的等位基因共享差异度(ASD)统计量窄范围解释机制研究
【字体: 大 中 小 】 时间:2025年06月18日 来源:Theoretical Population Biology 1.2
编辑推荐:
研究人员针对群体遗传学中广泛使用的等位基因共享差异度(ASD)统计量(D1 和D2 ),通过建立数学模型揭示了其期望值受最大等位基因频率(M)严格约束的现象。研究首次推导出在固定等位基因类型数(I)条件下ASD的上下界公式,并发现人类群体中观察到的ASD值(0.55-0.7)窄范围特征源于该数学约束。该成果为解释群体遗传分化模式提供了新的理论框架,对理解人类遗传多样性分布规律具有重要意义。
在群体遗传学研究领域,等位基因共享差异度(ASD)统计量是衡量个体或群体间遗传分化的核心工具。然而长期以来,研究者们观察到一个有趣现象:当跨越多位点计算时,人类群体间的ASD值往往集中在0.55-0.7的狭窄范围内,这一现象与理论上的[0,1]全范围形成鲜明对比。究竟是什么机制导致了这种"被压缩"的差异度分布?这个问题的解答对于正确解读遗传距离数据、理解人类群体演化历史具有关键意义。
发表在《Theoretical Population Biology》的研究通过建立严格的数学框架,首次揭示了ASD统计量的内在约束规律。研究人员聚焦于两种常用ASD统计量——基于等位基因集合交集的D1
和基于等位基因对比较的D2
,系统分析了它们在固定等位基因类型数(I)和最大等位基因频率(M)条件下的数学边界。研究采用的主要技术方法包括:1)建立ASD期望值的概率模型;2)应用Schur-凹函数和Majorization理论进行不等式推导;3)利用人类基因组数据(30个群体630个位点)进行实证验证;4)通过重排不等式确定极值点分布特征。
【研究结果】
固定等位基因类型数时的ASD边界
研究发现当仅固定I时,D1
的期望值上界为1-2/I+2/I2
-1/I3
,下界为0;D2
的上界为1-1/I,下界为0。这些边界仅在极端等位基因分布(完全均匀或完全集中)时达到,解释了实际观测值远离理论极值的原因。
固定最大等位基因频率时的约束
当同时固定I和M时,研究获得了更精确的约束范围:D1
的上界为1-2M2
+2M3
-M4
-(I-1)(2L2
-2L3
+L4
)(L=(1-M)/(I-1)),下界涉及取整函数?M-1
?。这些公式首次量化了M对ASD范围的压缩效应。
人类遗传数据的验证
对30个人类群体630个位点的分析显示,观测ASD值完全落入理论预测区域。特别是当I=6时,D1
和D2
的实际分布与M呈现显著负相关,完美符合1-M2
(D2
)和1-2M+2M3
-M4
(D1
)的约束曲线。
【结论与意义】
该研究建立了ASD统计量的完整数学约束体系,揭示了遗传差异度"被压缩"现象的本质是等位基因频率分布的数学必然。这一理论突破具有三重意义:1)为正确解读FST
等传统统计量提供了新视角,例如非洲群体间低FST
可能反映高多样性而非低分化;2)建立了连接微观等位频率与宏观遗传分化的定量桥梁;3)为设计新的不受M约束的遗传距离指标指明了方向。研究采用的Majorization理论框架还可拓展至其他群体遗传统计量的边界分析,为领域发展奠定了重要方法论基础。
生物通微信公众号
知名企业招聘