
-
生物通官微
陪你抓住生命科技
跳动的脉搏
加权TREE-QMC算法:提升基因树不完整性及系统误差下的物种树重建鲁棒性
【字体: 大 中 小 】 时间:2025年05月28日 来源:Systematic Biology 6.1
编辑推荐:
为解决基因树不完整性和系统误差对物种树重建的负面影响,研究人员开发了加权TREE-QMC算法。该研究通过整合Snir和Rao的QMC框架与基因树分支长度加权策略,显著提升了物种树准确性,尤其在处理大规模分类群时表现优于加权ASTRAL。实验表明,该方法对缺失数据和同源错误具有强鲁棒性,为超树构建提供了新工具。源码已开源。
在物种树重建领域,摘要方法(summary methods)常被用于整合因不完全谱系分选(ILS)而产生冲突的基因树。然而,基因树的不完整性和系统性误差会显著降低其准确性。为此,Zhang和Mirarab曾对流行算法ASTRAL进行改进,通过引入基于基因树分支长度和支持值的加权四重态(quartets)策略,但计算复杂度限制了其应用。
最新研究巧妙地将加权方案融入Snir和Rao的四重态最大割(QMC)框架,诞生了加权TREE-QMC。尽管算法时间复杂度略有增加,但实际运行时间仅呈常数级增长。模拟实验显示,该工具在处理大规模分类群时,其物种树重建精度甚至超越加权ASTRAL。尤为亮眼的是,在分析两组鸟类数据时,基因树分支长度加权策略展现出对系统性同源错误(homology errors)的强耐受性——其效果堪比直接删除受影响分类群或整个基因树的操作。
更令人惊喜的是,TREE-QMC对极端缺失数据率表现出惊人稳定性,这为其在超树(supertree)构建领域的应用铺平道路。研究团队已将该工具开源发布在GitHub平台,为进化生物学研究提供了强有力的新武器。
生物通微信公众号
知名企业招聘