
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于近似贝叶斯计算的马尔可夫二元树模型在系统发育学中的参数推断研究
【字体: 大 中 小 】 时间:2025年09月06日 来源:Journal of Theoretical Biology 2
编辑推荐:
为解决系统发育树中多样化速率(diversification rates)的变异性问题,研究人员开发了基于近似贝叶斯计算(ABC)的马尔可夫二元树(MBT)模型推断方法。通过模拟研究和实际数据验证,该方法能准确识别两相(phase)模型的出生率(λi)、死亡率(μi)和相变速率(qij),其精度优于传统最大似然法(ML),并在爬行动物卵生/胎生演化分析中验证了双向相变的生物学结论。该研究为复杂演化模型提供了免似然(likelihood-free)推断框架。
在生命之树的绘制过程中,系统发育树如何反映物种多样化速率的变异规律,一直是演化生物学的核心问题。传统线性出生-死亡模型假设所有物种具有相同的 speciation(物种形成)和 extinction(灭绝)速率,但现实中地理隔离、体型差异等众多因素会导致速率差异。虽然 BiSSE(二元状态物种形成-灭绝)等模型通过引入离散性状(state)改进了拟合效果,但随着模型复杂度增加,基于微分方程的似然计算变得极其耗时,且高度依赖分支长度等易误差的树形特征。
针对这一困境,Mingqi He等研究者另辟蹊径,将系统发育学与随机过程理论相结合,提出用马尔可夫二元树(Markovian binary trees, MBT)这一连续时间分支过程来建模。MBT允许物种处于不同 phase(相),每个相具有特定的出生、死亡和相变速率,能更灵活地捕捉多样化速率的异质性。但复杂模型的参数推断成为新难题——这正是本研究突破的关键点。
研究人员创新性地采用近似贝叶斯计算(Approximate Bayesian Computation, ABC)框架,通过模拟数据与观测树的形态统计量匹配来绕过似然计算。针对两相MBT模型(包括可简化相变与完全相变两种情况),团队设计了一系列定制化统计量:标准化谱系-时间曲线(nLTT)捕捉整体树形动态,改进的Colless平衡指数量化各相内部不平衡性,而独创的"相变统计量"则通过子树中相比例反推相变速率。通过ABC-PMC(基于种群蒙特卡洛的ABC)算法的迭代优化,该方法在模拟数据中展现出惊人精度——对出生率的推断误差普遍低于8%,即使对死亡率等难估参数,其50%可信区间也能覆盖真值。
尤为亮眼的是与主流最大似然法的正面较量。在六参数不可约模型测试中,ABC对相变速率q12的估计相对均方根误差(RRMSE)仅为0.16,而ML方法高达0.90。当应用于Pyron等学者构建的3951个物种的爬行动物树(卵生vs胎生性状)时,该方法不仅重现了胎生物种具有更高speciation rate(λ2=0.12±0.01)和extinction rate(μ2=0.09±0.02)的结论,更通过模型选择证实了双向相变的生物学假说(不可约模型后验概率0.73)。
关键技术方法包括:1) 基于MBT模型的树形模拟,设置两相出生(λ1, λ2)、死亡(μ1, μ2)和相变速率(q12, q21)参数;2) ABC-PMC算法实现参数后验分布的渐进逼近,采用动态调整的容忍阈值和样本量;3) 针对squamata(有鳞目)真实数据调整算法,处理单一大树而非多树数据集。
主要研究结果
3.1 可简化相案例
当禁止phase 2→phase 1相变时,即使死亡率相等(μ:=μ1=μ2),ABC对λ1的推断误差仅4%。引入相异死亡率后,虽phase 1参数精度下降,但整体生长率ω的估计仍保持稳健(RRMSE<0.05)。
3.2 不可约案例
在完全相变模型中,新设计的相变统计量Si(T)成功解耦双向相变信号。虽然phase 2死亡率μ2在高值时出现低估(约15%),但其与phase 1参数的协变关系仍被准确捕捉。
3.3 与ML方法对比
在100次重复实验中,ABC对q21的RRMSE(0.21)显著低于ML方法(0.91)。当参数随机生成时,ML出现过渡速率>100的异常估计,而ABC始终保持生物学合理范围。
4. 实际数据分析
squamata树分析显示胎生相(viviparous)具有更高speciation rate(λ2=0.12 vs λ1=0.08),支持"胎生加速物种形成"假说。相变速率后验分布表明q12>q21,但双向相变均不可忽略。
这项研究的意义不仅在于技术层面的创新——通过ABC框架将MBT模型转化为实用工具,更在于其方法论启示:当复杂模型的似然函数难以处理时,基于模拟的免似然推断可提供更稳健的解决方案。研究者特别指出,未来可扩展至更多相或隐藏相模型,而如何设计适用于高维参数的统计量将是关键挑战。正如讨论部分强调的,这项工作为理解"性状依赖性宏演化"打开了新窗口,其应用于squamata的分析,为卵生-胎生演变的可逆性争议提供了定量证据。论文成果已发表于《Journal of Theoretical Biology》,为系统发育分析提供了新的建模范式。
生物通微信公众号
知名企业招聘