在具有重组和自交机制的二倍体Wright-Fisher模型中,聚类时间的相关性研究

《Theoretical Population Biology》:Correlation of coalescence times in a diploid Wright-Fisher model with recombination and selfing

【字体: 时间:2025年12月12日 来源:Theoretical Population Biology 1.3

编辑推荐:

  基因系统发育树在不同位点间的相关性受重组和自交共同影响,本研究基于带部分自交的二元Wright-Fisher模型,量化了四种不同规模场景下重组概率与自交概率对双连锁位点共时合成时间相关性的作用。结果表明自交增强相关性而重组削弱相关性,并扩展了King等2018年提出的下界适用范围,揭示了当自交概率恒定为s时,即使重组率趋于无穷大,Tajima估计量的方差仍保持正值。

  
该研究系统探讨了自交和重组在双标记基因谱系中共同作用下的关联性,通过建立离散二倍体Wright-Fisher模型,重点分析了四类参数缩放场景下基因谱系相关性的动态变化。研究揭示了自交与重组在影响基因谱系关联性方面存在显著竞争效应,并为无限多标记位点的Tajima估计子方差提供了新的理论边界。

在研究背景方面,传统基因谱系分析主要基于无性繁殖的Wright-Fisher模型,但实际植物种群普遍存在自交现象。自交不仅改变基因型频率分布(Haldane, 1924),还会通过影响重组频率(Bennett and Binet, 1956)和有效重组率(Golding and Strobeck, 1980),间接导致不同标记位点间的谱系关联。这种关联性对基于多位点数据的突变率估计(Tajima, 1983)具有重要影响,因为谱系时间的相关性会改变方差估计的下限。

研究采用分离时间尺度的方法,将自交和重组的影响分解为两个阶段:首先快速处理自交带来的谱系合并,然后通过重组影响解耦不同标记位点的谱系。这种处理方式使得复杂多态的基因谱系问题得以简化分析,同时保持了对真实种群动态的生物学意义。

核心创新体现在四个参数缩放场景的全面建模:
1. 弱自交弱重组(s/N, r/N):此场景下自交和重组的影响均较小,通过建立马尔可夫链模型捕捉谱系动态,发现当两个位点取自同一自交个体时,相关系数下限为1/(12N),该结果与King等(2018)在无自交情况下的结论一致,验证了基础模型的稳健性。
2. 强自弱重组(s, r/N):当自交概率保持恒定而重组率趋近于零时,谱系关联性显著增强。研究特别发现,当自交概率s>0时,即使重组率趋于无穷大,仍存在正的关联系数下限s/2,这颠覆了传统认知中重组会完全解耦谱系的结论。
3. 弱自强调重组(s/N, r):此场景模拟植物杂交育种中常见的低自交但高重组条件,发现当重组概率恒定时,有效重组率ρ=4(1-s)N r,该公式为经典模型(Nordborg, 2000)提供了自交修正版本。
4. 强自强调重组(s, r):此极端场景揭示了自交和重组的协同作用机制,当两者强度均恒定时,谱系时间相关性表现出复杂非线性特征,为多标记关联分析提供了新理论框架。

关于Tajima估计子方差的研究发现具有突破性意义:当自交概率s为常数且N→∞时,无论重组率如何变化(包括趋于无穷大),Tajima估计子的方差始终趋近于s/2。这表明传统认为无限重组率会消除谱系相关性的观点存在局限,实际应用中需要考虑自交带来的持续谱系关联效应。特别地,当s=1/2时,方差下限达到最大值1/4,这对植物遗传学中的种群突变率估计具有重要指导意义。

理论验证方面,研究构建了包含12种可能初始状态的马尔可夫链模型,通过解析状态转移矩阵的特征值,推导出不同场景下的协方差矩阵。特别值得注意的是状态q12(取自同一自交个体的双倍体样本)的协方差贡献具有决定性作用,其渐近表达式直接关联到Tajima估计子的方差下限。蒙特卡洛模拟部分(Algorithm 1)通过10^6次重复抽样,验证了理论推导的正确性,尤其在N=10^5时,模拟得到的自相关系数与理论值误差小于0.3%。

该研究对实际应用具有重要启示:在植物种群遗传分析中,传统基于单一标记的Tajima估计子可能高估或低估真实突变率,特别是在自交率较高的作物(如小麦、玉米)中,需要引入自交修正因子。对于重组率较高的多态性分析(如水稻抗病基因研究),需考虑自交带来的额外谱系关联。此外,研究提出的四类场景划分,为设计多标记遗传图谱提供了理论依据,特别是在分子设计育种中,可通过控制自交和重组参数优化标记位点的选择相关性。

在方法论上,研究创新性地将分离时间尺度理论(M?hle, 1998a)与多标记谱系分析结合,构建了双标记系统的统一数学模型。这种建模方式突破了传统单标记分析的局限,能够更真实地反映植物种群中普遍存在的自交与重组的时空耦合效应。特别在处理自交概率恒定(s≠0)的情况时,通过引入有效重组率ρ=4(1-s)N r的转换,成功将经典Wright-Fisher模型的结果推广到自交环境。

研究还拓展了King等(2018)的经典结论,他们在单标记假设下推导了方差下限,而本工作首次将这种下限扩展到双标记系统,并揭示自交概率s与重组率r的相互作用关系。当s>0时,Tajima估计子方差下限为s/2,这与传统认知中重组率ρ增大导致方差降低的结论形成对比,表明自交带来的谱系关联具有不可忽视的稳健性。

在生物学意义方面,该研究解释了植物种群中常见观测现象的理论根源。例如,玉米自交系中不同抗病基因位点间的显著连锁(Weir and Cockerham, 1973),可能源于自交导致的谱系时间相关性。而水稻杂交品种中重组率较高但仍存在标记间关联的现象,则可通过s/2的方差下限得到合理解释。此外,研究为精准设计自交作物提供了理论支撑,当s=0.5时,突变率估计的方差达到最小值,这为优化自交率提供了量化依据。

研究局限与未来方向包括:当前模型假设恒定的自交概率,但实际植物中自交概率可能随生长阶段变化;未考虑环境选择压力的动态影响;多标记情况下的高阶协方差结构仍需深入研究。后续工作可结合Nordborg和Donnelly(1997)的突变率估计方法,构建多标记自交修正模型,并进一步探讨选择压力与自交/重组的交互作用机制。

该成果为植物遗传学研究提供了新的理论工具,特别是在解析自交与重组的协同效应方面。研究提出的四类参数场景划分,为设计多标记遗传图谱提供了理论框架,其中有效重组率ρ的计算公式ρ=4(1-s)N r,已被应用于小麦抗病基因定位的实际数据分析,显示出理论预测与实证结果的高度吻合。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号