将基于系统发育信息的物种组合间距离分解为基部和末端两个组成部分
《Theoretical Population Biology》:A decomposition of a phylogenetically-informed distance between species assemblages into basal and terminal components
【字体:
大
中
小
】
时间:2025年11月08日
来源:Theoretical Population Biology 1.3
编辑推荐:
本研究探讨系统发育信息距离的数学基础,揭示PQ距离过度侧重基部分析的现象,并提出通过调节MPQ距离权重来平衡不同尺度结构,结合模拟与真实数据验证其有效性。
在生态学研究中,科学家们常常需要量化不同物种群落之间的差异。这些差异不仅体现在物种组成上,还涉及物种之间的进化关系。因此,许多研究者采用了结合物种组成和系统发育关系的差异度量方法。然而,尽管存在多种这样的差异度量方式,它们的统计特性仍然不够明确。例如,在比较两种不同类型的地点中物种丰度时,使用PERMANOVA分析结合UniFrac差异度量可能得出一个结论,而使用Rao的差异度量系数却可能得出另一个不同的结论。在某些情况下,这种差异甚至可能导致显著性模式的反转。虽然这些现象在实际研究中已经被广泛记录,但其背后的数学原理尚未得到充分理解。
本文探讨了一种在系统发育信息基础上构建的差异度量方法,该方法在文献中以不同的名称出现,如Rao的DISC(Radhakrishna, 1982)、H(Jér?me et al., 2007)、δCO(Sandrine et al., 2004)以及与PST(Olivier and Bruno, 2007)相关的度量。我们展示了这种差异度量可以被分解为多个部分,这些部分分别对应于系统发育树的基部和末端结构。进一步地,我们发现这种度量方法在计算时对基部结构赋予了极高的权重,而对末端结构则相对忽视。这意味着,该度量方法在评估群落差异时,更关注那些在进化过程中较早分支的物种群,而对近期分支的物种群变化则不太敏感。
这种现象在某些情况下可能与将物种丰度数据汇总到更高分类层级(如门级别)后进行差异分析的结果相似。然而,这种行为可能并不总是符合研究者的需求。为了解决这一问题,我们提出了一种新的方法,即通过使用一组已有的差异度量方法,可以构建一个从原始系统发育信息度量到所有物种均等区分度量的中间度量体系。这种方法不仅能够帮助研究者更全面地理解群落差异,还能够提升检测不同系统发育尺度上差异的能力。例如,通过调整基部结构的权重,可以增强对某些特定尺度上差异的识别能力。
为了更深入地理解这一现象,我们首先回顾了相关的系统发育信息度量方法,并提供了必要的数学背景。我们展示了如何将这些度量方法重新表达为一组“衍生变量”的加权欧几里得距离。这些衍生变量是基于物种丰度和系统发育树构建的,其权重由系统发育树的结构决定。我们还给出了在两种特定系统发育树类型(如完美二叉树和梳状树)下这些衍生变量的具体表达式,以及它们在计算中的权重分配。这些表达式在目前的文献中尚未被详细阐述。
我们进一步展示了,这些衍生变量在系统发育树上形成一个连续的梯度,从描述基部结构的变量到描述末端结构的变量。同时,我们发现,只有少数几个与基部结构相关的衍生变量对差异度量的贡献较大,而其他变量则影响较小。这意味着,该差异度量对基部结构的丰度变化非常敏感,而对于末端结构的丰度变化则相对不敏感。这种特性可能使得某些研究者在分析数据时产生误解,认为群落差异主要来源于基部结构的变化,而忽略了末端结构可能存在的显著差异。
为了增强差异度量的灵活性和适用性,我们引入了一种新的度量方法,即MPQ距离。这一方法通过对原始PQ距离中基部结构的权重进行调整,使得研究者可以根据实际需求,选择不同的权重比例来检测不同系统发育尺度上的差异。例如,当研究者关注的是系统发育树较深的分支时,可以增加基部结构的权重;而当研究者希望更关注近期分支的变化时,则可以减少基部结构的权重。这种调整不仅可以提升差异度量的统计功效,还可以帮助研究者更准确地识别群落差异的来源。
在实际应用中,我们通过模拟数据和真实数据集展示了这一方法的有效性。在模拟数据中,我们构建了不同系统发育结构的群落,并通过调整MPQ距离中的参数r(取值范围为0到1),观察到差异度量对不同系统发育尺度的响应变化。而在真实数据集中,我们分析了多个生态系统的物种组成和系统发育信息,发现通过调整r值,可以更清晰地揭示群落差异的系统发育背景。这些结果表明,MPQ距离不仅能够提供更全面的差异分析,还能帮助研究者在不同系统发育尺度上识别重要的生态模式。
我们还讨论了这些差异度量方法在生态学中的潜在应用。在系统发育信息的基础上,这些方法可以用于微生物群落分析、群落结构研究以及生态系统的比较分析。例如,在微生物群落研究中,使用MPQ距离可以帮助研究者识别哪些微生物群落的差异主要来源于系统发育较远的分支,哪些差异则主要来源于近期的分支。这有助于更深入地理解微生物群落的组成和功能多样性之间的关系。
此外,我们还探讨了这些差异度量方法在生态学中的理论意义。通过将系统发育信息与物种丰度数据相结合,这些方法提供了一种更精细的差异度量方式,能够捕捉到传统方法可能忽略的生态信息。例如,在某些情况下,传统的差异度量可能过于关注物种的绝对丰度,而忽略了它们之间的系统发育关系。相比之下,系统发育信息度量方法则能够更全面地反映物种之间的进化距离,从而提供更准确的群落差异评估。
在本文的最后部分,我们介绍了相关的数据和代码资源。我们开发了一个R软件包,允许用户轻松计算PQ和MPQ距离。该软件包与phyloseq(McMurdie and Holmes, 2013)集成,后者是存储物种丰度和系统发育树数据的常用工具。通过使用这个软件包,用户可以创建交互式图表,直观地观察不同r值对差异度量的影响。这一工具的开发不仅提高了研究的可重复性,还为生态学研究者提供了一个便捷的平台,用于探索和应用系统发育信息度量方法。
综上所述,本文通过数学分析揭示了系统发育信息度量方法中基部结构的重要性,并提出了MPQ距离这一新的度量方法,以增强对不同系统发育尺度上差异的检测能力。这些结果不仅有助于更准确地量化群落差异,还为生态学研究提供了新的工具和视角,使得研究者能够更全面地理解物种组成和系统发育关系之间的相互作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号