
-
生物通官微
陪你抓住生命科技
跳动的脉搏
时间齐次合并过程下无限位点突变模型的矩阵解析采样公式及其在群体遗传学中的应用
【字体: 大 中 小 】 时间:2025年06月18日 来源:Theoretical Population Biology 1.2
编辑推荐:
本研究针对时间齐次合并过程下无限位点突变模型的概率计算难题,开发了基于多元相位型分布和奖励矩阵的矩阵解析框架。研究人员通过构建概率生成函数(PGF),提出了一种仅需单次矩阵求逆运算的高效算法,成功解决了传统符号计算仅适用于小样本的局限。该成果为群体遗传学中位点频谱(SFS)概率计算提供了新方法,在结构化群体和Beta-合并过程等复杂模型中展现出独特优势。
在群体遗传学研究中,准确计算特定遗传样本的出现概率是理解种群历史和进化动力的关键。传统方法在处理时间齐次合并过程下的无限位点突变模型时面临严峻挑战,特别是当涉及复杂的人口结构或非标准合并过程时。现有基于符号计算的概率生成函数(PGF)方法虽然理论上可行,但受限于计算复杂度,仅能处理不超过6个样本的小规模数据。这种局限性严重制约了研究人员对自然种群中观测到的遗传变异模式进行精确建模的能力。
来自中国的科研团队在《Theoretical Population Biology》发表了一项突破性研究,他们创新性地将排队论中的多元相位型(MPH)分布理论引入群体遗传学,建立了基于矩阵运算的解析框架。该研究通过定义初始状态向量α、子强度矩阵S和奖励矩阵R,构建了能够精确描述分支长度联合分布的概率模型。针对无限位点突变过程,研究人员推导出矩阵形式的概率生成函数G(z)=α[-S+λ△(Re)-λ△(Rz)]-1
s,并开发了仅需单次矩阵求逆的高效算法。
关键技术方法包括:1) 基于Kulkarni多元相位型分布建立分支长度联合分布模型;2) 构建包含突变率λ的奖励变换矩阵;3) 开发矩阵微分算法计算样本概率;4) 应用离散马尔可夫链状态空间方法处理总突变数分布;5) 针对Beta-合并过程等特殊模型进行参数化分析。研究使用n=3样本的位点频谱作为示例验证方法有效性。
【概率生成函数框架构建】
研究团队首先建立了完整的理论框架,证明在时间齐次合并过程中,分支长度B=(B1
生物通微信公众号
知名企业招聘