鸟类骨骼性状大规模数据集构建及其在生态与进化研究中的应用

【字体: 时间:2025年05月29日 来源:Scientific Data 5.8

编辑推荐:

  为解决鸟类骨骼性状数据集匮乏问题,研究人员利用计算机视觉技术,从博物馆骨骼标本照片中识别测量骨骼,构建涵盖 2057 种雀形目鸟类、14419 个体的数据集,还通过系统发育模型插补缺失数据,为相关研究提供新资源。

  
在生态与进化研究领域,对生物多样性大规模模式的理解以及这些模式的生态和进化起源与影响的探索日益受到关注。然而,长期以来,在大空间和分类尺度上,可用于比较的定量性状数据集有限,这极大地制约了相关研究的发展。尽管在维管植物、蜥蜴、淡水鱼等多个类群中,大规模性状数据集逐渐涌现,但在鸟类这一宏观生态学和宏观进化学的模式系统中,骨骼性状数据的积累却远远落后于外部性状数据。鸟类骨骼在鸟类运动、飞行物理、系统发育关系、对环境变化的响应等方面能提供关键见解,且与其他表型数据结合研究时能带来新发现,如整合骨骼和羽毛性状数据可揭示艾伦法则(Allen’s Rule)的新机制。因此,构建全面的鸟类骨骼性状数据集对于推动鸟类形态学、生态学和进化学的研究具有重要意义。

为填补这一研究空白,美国密歇根大学环境与可持续发展学院等机构的研究人员开展了相关研究。他们利用计算机视觉技术,从博物馆骨骼标本照片中识别和测量骨骼,构建了一个广泛的鸟类功能性重要骨骼元素数据集。该研究成果发表在《Scientific Data》上,为鸟类生态与进化研究提供了重要的数据支撑。

研究人员主要采用了以下关键技术方法:首先是样本采集,大部分数据来自密歇根大学动物学博物馆(UMMZ)的骨骼标本,还从芝加哥菲尔德自然历史博物馆(FMNH)补充了标本,最终拍摄了涵盖 2057 种鸟类、14419 个个体的标本。其次是摄影技术,使用固定距离的成像设备对标本进行拍摄,生成具有特定像素尺寸的照片。然后是性状测量,应用基于深度神经网络的 Skelevision 方法,该方法整合了 U-Net 和 Mask R-CNN,对照片中的骨骼元素进行分割、识别和测量,测量了 12 个骨骼元素的相关性状,并过滤掉低置信度的估计值。最后是系统发育数据插补,使用 Rphylopars 基于多元系统发育模型对缺失数据进行插补,并通过验证测试评估了插补的准确性。

数据集覆盖范围与结构


该数据集涵盖雀形目(Passeriformes)2057 种鸟类,占雀形目物种的 34%,代表 89% 的雀形目科,样本空间分布广泛,包括雀形目所有分布大陆的标本。数据集包含三种格式:仅包含直接测量性状值的标本级数据集、包含直接测量和插补值的无缺失数据标本级数据集,以及通过多元进化模型得出的完整物种级数据集。分类学与现有的综合鸟类系统发育和外部功能性状数据集协调一致,便于与其他数据集整合。

技术方法与验证


研究使用 Skelevision 技术对骨骼标本照片进行处理,该技术通过深度学习模型识别骨骼元素并测量其最长线性维度,过滤掉分类置信度低于 0.95 的结果以确保数据质量。在技术验证方面,对比手工测量结果,UMMZ 标本的 Skelevision 测量平均均方根误差(RMSE)为 0.89 mm,FMNH 标本为 1.78 mm,误差水平与人类测量误差相当。对于缺失数据插补,采用基于多元布朗运动模型(mvBM)的 Rphylopars 方法,通过留一法验证表明,插补数据的 RMSE 低且稳定,百分比偏差(P-bias)小于 1%,显示出较高的准确性和鲁棒性。

数据可用性与扩展潜力


数据集可在 Dryad 存储库获取,包含物种双名法、标本目录号等信息。未来可通过拍摄更多类群、训练模型识别新骨骼元素或分析现有图像扩展数据集。研究方法开源,便于其他研究者应用和扩展,为鸟类骨骼性状研究的持续发展提供了技术基础。

这项研究构建的大规模鸟类骨骼性状数据集,填补了鸟类功能性状数据在骨骼系统的空白,为整合多解剖系统数据研究鸟类形态变异机制提供了可能。通过结合系统发育关系和多元模型插补缺失数据的方法,提高了数据集的完整性和实用性,为探讨鸟类形态的宏观尺度模式、环境变化对鸟类形态的影响等提供了关键数据支持。该研究不仅推动了鸟类生态学和进化学的发展,还为其他类群的性状数据集构建提供了方法借鉴,有助于深化对生物多样性形成和维持机制的理解。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号