编辑推荐:
本文构建了世界鸟类物种完整的、有时间尺度的进化树(Aves 1.3),整合 262 项研究数据,统一 9239 种鸟类系统发育估计,能与多数据资源关联分析。其方法遵循 FAIR 原则,可更新且适用于其他类群研究,为鸟类演化研究提供了重要框架。
研究背景
鸟类备受关注且研究广泛,每年都有许多新的系统发育研究揭示鸟类进化关系。然而,以往数据资源间的壁垒限制了大规模分析。生命之树虽能整合数据,但进化树获取受限,大规模生物多样性估计常依赖过时的系统发育和分类关系。Open Tree of Life 项目旨在打破这一隔阂,统一分类群的系统发育估计。本研究应用其工具,构建完整且可更新的鸟类进化树。
研究方法
- 数据整合:从 1990 - 2024 年的 262 项研究中筛选并整理 281 棵鸟类系统发育树,其数据和元数据存储于 Open Tree 数据存储库 phylesystem。通过创建分类翻译表,将树中的节点映射到 Open Tree 分类法(OTT v3.6)等多种分类系统的标识符,以链接不同分类系统的分类单元名称。
- 系统发育合成:按发表年份对输入树进行排序(部分大型超矩阵树除外),使用 Open Tree 合成软件,结合分类学骨干,通过贪心算法添加分支构建超级树。分解整体任务为子问题,依据单系类群解决,存储输入树与结果估计间的一致性和冲突作为合成树元数据。
- 添加无系统发育信息的分类单元:修剪合成树,识别 Clements 分类法中缺失的分类单元,生成添加语句,随机化添加顺序并多次迭代,生成 100 棵完整的二叉系统发育树。
- 估计日期:使用 Chronosynth 软件,将 Open Tree 数据存储库中的日期估计映射到合成树节点,作为二次节点校准,通过随机采样和 Phylocom 包中的 bladj 进行平滑处理,用 RevBayes 总结为最大分支可信度树。
- 分类学更新:将合成树映射到 Open Tree 分类法和 Clements 分类法的多个版本,随新研究和分类法更新发布新版本的合成树估计。
研究结果
- 进化树构建:统一 281 个输入系统发育树,构建 9239 种鸟类的系统发育合成树,利用分类学信息添加缺失分类单元,生成与 2021、2022、2023 年 Clements 分类法对应的完整树。树中每个分支可追溯到支持的输入研究,通过唯一分类单元标识符可实现不同分类法间的转换。
- 数据匹配情况:对 Clements 2021 分类法中 10824 种鸟类,9239 种有系统发育信息(2022 年:9207/10906;2023 年:9189/11017)。通过 OTT 匹配 35534(86%)个输入研究节点到 Clements 分类法物种。
- 分支支持与冲突:多数分支由 1 - 5 个系统发育树支持,部分节点最多由 24 个输入树支持。约 34% 的分支与至少一项研究冲突,14% 的分支冲突研究多于支持研究,可能源于不同数据类型的推断差异。
- 分类学一致性:合成树与 Clements 分类法基本一致,但部分分类单元存在差异。如一些科在早期分类法中并非单系群,后逐渐修正;约 8% 的属在系统发育合成树中不是单系群。
- 时间估计:利用 90 项研究中 120 棵树的日期估计,为树中约 63% 的内部节点提供日期信息。根节点 Aves 平均年龄为 99 Mya,与近期研究相符。但部分节点日期估计差异大,近 40% 的节点无输入日期信息,为简单插值。
讨论
- 方法优势与局限:本研究扩展了早期 Open Tree 合成软件构建的合成树,提高了软件效率。虽综合了多研究信息,但结果准确性取决于输入树,且未考虑原始估计的不确定性区间。
- 分类学重要性:分类学是项目间互操作性的关键,统一不同资源和时间的分类学概念困难,本研究通过精心策划的过程平衡了与多种资源的链接。树中节点映射到多种分类法,便于分类学更新。
- 研究意义与应用:本研究为鸟类研究提供了进化框架,可与 eBird 等数据资源链接分析,探索鸟类关系的一致性和冲突,指导未来研究。虽该方法适用于其他类群,但对于特定研究,若有高质量的日期树,建议优先使用。