
-
生物通官微
陪你抓住生命科技
跳动的脉搏
植物营养竞争中的适应性动态资源分配可导致“公地悲剧”现象
《Journal of Thermal Biology》:Adaptive dynamic resource allocation can cause tragedy of the commons in plants with nutrient competition
【字体: 大 中 小 】 时间:2025年09月24日 来源:Journal of Thermal Biology 2.9
编辑推荐:
本研究针对微生物基因组数据快速增长背景下系统发育树动态扩展的稳定性问题,创新性提出了一种名为"叶地址编页(folio)"的系统发育树编码方法。该研究通过给每个叶节点分配基于参考顶点路径的地址标识,实现了新增叶节点的地址分配不改变现有结构编码的稳定性。研究表明该方法能够唯一恢复树结构,支持子树提取和聚类分析,在沙门氏菌基因组数据中得到验证,为分子流行病学和大规模微生物分类提供了稳定的系统发育编码框架。
随着基因组测序技术的飞速发展,微生物基因组数据呈现爆炸式增长,这对系统发育分析提出了新的挑战。在分子流行病学研究中,病原体分离株的实时测序会导致新的分类群不断出现,迫切需要能够有效扩展现有系统发育树的方法。虽然目前已经开发了多种计算方法来将新序列放置到现有树中,避免了从头重建树的麻烦,但这些树扩展方法要完全整合到分类体系中,需要一种能够保持现有树结构稳定的编码系统。
传统系统发育树编码方法如Newick格式虽然直观且广泛应用,但在动态扩展时存在局限性。当新分支出现时,现有树结构可能需要进行调整,这给分类体系的稳定性带来了挑战。特别是在微生物分类和传染病动态研究等领域,需要一种能够支持迭代添加新分离株的编码策略,同时保持原有分类标签的稳定性。
为了解决这一问题,研究人员开发了一种称为"叶地址编页(folio)"的新型系统发育树编码系统。该方法通过记录从参考顶点到每个叶节点的路径,为每个叶节点分配一个唯一的地址标识。当新增叶节点时,只需按照简单规则分配新地址,而不会改变已有叶节点的地址编码。这种编码方式具有稳定性,随着新地址添加到编页中,编码本身不会发生变化,且能够从地址编页中唯一恢复出完整的树结构。
该研究发表在《Journal of Thermal Biology》上,研究人员主要采用了系统发育树构建与分析、叶地址编码算法设计、树重构验证等方法。研究中使用了沙门氏菌(Salmonella)基因组数据作为验证案例,通过模拟数据和真实微生物基因组数据对方法进行了测试。关键技术包括基于Fitch-Margoliash准则的叶放置方法、二进制分数平均的芽标签生成算法,以及兼容性叶地址对的数学定义和验证。
研究结果显示,这种编码方法能够有效支持系统发育树的稳定扩展。在"系统发育树的新编码"部分,研究人员详细阐述了如何使用叶地址编页来编码树结构。他们定义系统发育树T为具有不同标签顶点的树,指定参考顶点为0,通过从0到叶节点x的路径上的顶点标签序列来分配地址,形式为a-b-...-c-x。这种编页能够唯一地重建树结构,只需按照特定步骤逐个添加地址路径中的顶点和边。
在"稳定地向编页添加叶节点"部分,研究展示了如何在不改变现有地址的情况下添加新叶节点。当新叶节点需要细分目标边时,会创建一个称为"芽(bud)"的新顶点,其标签采用a.b形式,其中b是通过邻接芽标签的二进制分数平均得到的二进制字符串。这种方法确保了即使芽添加顺序不同,标签的相对顺序也能保持芽在茎上的相对位置。
研究人员还证明了"编页中的地址满足兼容性属性",即从树产生的任何编页都是兼容的。兼容性是指任何两个地址会共享一个前缀(可能为空),超过此前缀后,通往其叶节点的路径会分岔且不再有共同的茎。这种属性对于从编页重建树是必要且充分的。
在"从兼容编页重建扩大的树"部分,研究描述了即使编页包含新增叶节点的地址,仍然能够确定性地重建树。通过处理包含芽的标签,根据芽标签的二进制值顺序在茎上适当位置添加新顶点,最终完成从芽到该地址叶节点的路径。
该方法在实际应用中表现出良好的效果。"从编页提取子树"功能使得能够轻松提取完整树的子树。通过叶节点地址共享的共同前缀,可以立即识别出进化枝,即使选择的类群不一定是单系的,也能通过提取相应地址的子集来轻松重建它们的关系。
研究人员开发了R包"splade"来实现编码及其应用功能。在"使用模拟数据说明编页编码"的验证中,通过从模拟序列生成的初始树开始,成功将先前移除的序列重新添加到由该树生成的编页中,确认了叶放置方法能够准确选择目标边。
最后,在"使用沙门氏菌数据说明编页编码"的实际应用中,分析了沙门氏菌 Typhimurium的核心基因组多态性数据。通过两个阶段的序列添加,展示了编页方法如何帮助不断增长的树的分类,通过检查新增叶节点的前缀,很容易描述它们与现有叶节点和进化枝的关系。
该研究的结论部分强调,叶地址编页编码具有由于其设计而拥有的有用特性。这种编码将树的结构映射到地址编页,分支长度与顶点标签一起存储在额外列表中。该框架开发了一种向编页添加叶节点的方法,该方法能在不改变任何先前分配地址的情况下保持树的结构,这种编码是稳定的,允许轻松从中恢复扩大的系统发育。
在讨论部分,研究人员指出稳定性在序列数据库和系统发育定期更新的环境中非常重要。在系统发育增长的情况下,能够参考树来稳定命名进化枝是非常有用的。虽然本研究没有明确提出新的分类系统,但这种编码框架有助于创建新系统或支持现有系统。与传统方法相比,这种叶地址系统标记和使用树的所有内部顶点,能在不丢失任何系统发育信息的情况下压缩树数据。
除了促进现有树扩展的主要动机外,编页编码还允许其他类型的树操作,使得基于与树叶节点类群相关的任何外部特征来修剪树或提取子树变得容易。通过选择相应的叶节点地址,可以轻松提取代表特定地理区域、形态特征或人口统计学特征的子树,提取的子树可以是进化枝或多系类群集合。
这种编码视角支持系统发育分析的建议为未来发展提供了途径。由于地址既用于标记类群又携带树拓扑信息,因此可以直接根据类群在系统发育中的相对位置分析与类群相关的特征。此外,叶地址编码还可以促进系统发育的操作,由于子树易于处理,可能使用叶地址来表示系统发育的操作。
生物通微信公众号