基于深度学习的野外摄影技术揭示哥伦比亚淡水鱼类形态多样性谱系

《Zoomorphology》:Deep learning on field photography reveals the morphometric diversity of Colombian freshwater fish

【字体: 时间:2025年10月31日 来源:Zoomorphology 1.1

编辑推荐:

  本研究针对传统形态测量方法依赖标本保存导致形态失真、难以大规模分析的问题,开发了一种集成Segment Anything Model (SAM)和Grounding DINO的人工智能工作流,实现了对野外拍摄的活体鱼类图像进行自动化分割和形态特征提取。该研究应用于涵盖哥伦比亚78%目级、82%科级、41%属级和25%种级淡水鱼类的CavFish-Colombia数据集,分割准确率超过97%,首次构建了基于自然体型的哥伦比亚淡水鱼类结构化形态空间,揭示了与运动功能和栖息地利用相关的体型大小和轮廓梯度,为生物多样性评估、功能性状分析和生态研究提供了准确、快速、可扩展的非侵入性形态监测新方案。

  
在生物多样性热点区域哥伦比亚,淡水鱼类呈现出极高的物种丰富度,据最新统计约有1711种,分布于亚马逊河、奥里诺科河、加勒比海、马格达莱纳-考卡河及太平洋流域等重要水文区域。这些鱼类不仅是生态系统健康的关键指示生物,更在维持生态完整性、促进养分循环和支撑 trophic interactions 中扮演着不可或缺的角色。尤为引人注目的是其伴随物种多样性而来的巨大形态差异,从圆润深体到流线细长,各种体型反映了鱼类在运动、摄食、繁殖及栖息地利用等方面的不同适应策略。然而,长期以来,准确捕捉并量化这种形态多样性的努力一直受限于传统形态测量方法。这些方法通常依赖于对保存标本的手工测量或基于 landmark 的几何形态计量学,不仅耗时费力、易引入人为误差,更关键的是,标本在固定和保存过程中产生的形态畸变严重干扰了物种间的准确比较和生态学解释,使得我们难以获取鱼类在自然状态下的真实体型。
为了克服这些局限,野外摄影技术应运而生,成为一种非侵入性且能标准化的替代方案。通过诸如 PhotaFish 系统这样的标准化拍摄装置,研究人员能够在鱼类被捕捞后迅速获取高分辨率图像,最大限度地减少对活体的压力并保留其自然体色、可数性状和形态特征。尽管如此,从这些图像中自动、精确地提取形状信息,尤其是对于高度多样化的类群,仍然是一个巨大的挑战。现有的人工智能方法,无论是专注于识别关键解剖标志点的 landmark detection 模型,还是用于勾勒鱼体轮廓的 segmentation 模型(如 Mask R-CNN、U-Net 等),在面对哥伦比亚高度异质性的鱼类区系时,其泛化能力受到诸多因素制约:包括训练数据的 taxonomic and geographic bias、缺乏覆盖整个表型谱系的公开图像库、模型在异质性野外照片上的准确性存疑、以及对稀有或特殊体型(如背腹扁平、缺失某些鳍的类群)的代表性不足等。
针对上述研究空白,本研究提出了一种新颖的、基于 foundational models 的自动化工作流程,旨在对哥伦比亚淡水鱼类的形态多样性进行大规模、非侵入性的表征。该研究利用集成了 Grounding DINO 和 Segment Anything Model (SAM) 的深度学习 pipeline,对来自 CavFish-Colombia 数据库的 1749 张标准化野外鱼类图像进行自动化分割和形态特征提取。CavFish-Colombia 是一个精心策划的视觉目录,涵盖了哥伦比亚已知淡水鱼类 78% 的目(11个)、82% 的科(48个)、41% 的属(189个)和 25% 的种/形态种(428个),图像均采用 PhotaFish 系统获取,确保了背景、光照和拍摄角度的一致性。
研究人员采用的技术方法核心是一个四阶段的自动化流程。首先,利用经过 FishNet 数据集 fine-tune 的 Grounding DINO 模型进行鱼类目标的自动检测,生成边界框。接着,将边界框作为 prompt 输入到 SAM 模型中进行精确的图像分割,生成高分辨率的鱼类掩模(mask)。然后,通过 Intersection over Union (IoU) 和 Dice 系数等指标,将 SAM 产生的分割结果与专家手动标注的 ground-truth 进行比对验证,确保分割的准确性。最后,从验证通过的掩模中提取一系列形态计量描述符,包括面积、周长、直径、紧凑度以及 Hu 不变矩和 Zernike 矩等,这些描述符能够量化鱼类体型的大小和轮廓特征。基于这些描述符,研究通过主成分分析 (PCA) 来降维并构建形态空间(morphospace),利用核密度估计 (KDE) 可视化物种在形态空间中的分布概率,从而揭示哥伦比亚淡水鱼类的形态多样性谱系。
分割过程
研究结果显示,该 AI 工作流的分割过程表现出极高的准确性。平均 Dice 系数达到 0.98,平均 IoU 为 0.97。两者的分布都紧密围绕均值,表明分割结果具有高度的一致性。通过 Beta 分布进行的统计阈值分析识别出的异常值(如 Dice 系数低于 0.91 或 IoU 低于 0.89)仅占全部图像的 1.6%,证明了该流程的低错误率。分割中的错误主要出现在少数几种情况:当鱼类靠近鱼缸壁或水面时可能误分类非生物元素;偶尔会遗漏如触须和小鳍等细微形态结构;以及在包含多条鱼的图像中可能只聚焦于单个个体。
形态性状提取精度
在形态性状提取的准确性方面,模型对鱼类面积(像素2)和周长(像素)的预测表现出色。预测值与观测值之间的决定系数 (R2) 对于面积达到 0.995,对于周长为 0.945,显示出极好的一致性。面积预测的均方根误差 (RMSE) 为观测值均值的 5.56%,而周长预测的 RMSE 为 12.66%,后者相对较高可能源于对边界划分更为敏感或数据变异性较大。残差预测偏差 (RPD) 值(面积:14.695,周长:3.721)表明模型对这两个测量值都具有很高的预测能力,其中面积估计的精度更高。
形态多样性分析
主成分分析 (PCA) 揭示,前四个主成分 (PCs) 共同解释了哥伦比亚淡水鱼类物种间 93% 的形态变异。PC1(贡献率 41.7%)代表了一个从大体型、轮廓圆润的物种(如 Characiformes 目中的 Serrasalmus sp.)到小体型、轮廓细长物种(如 Synbranchiformes 目中的 Synbranchus marmoratus)的梯度,反映了体型大小和基本形状的根本差异。PC2(贡献率 27.4%)主要与周长相关,将具有大而不规则轮廓(通常与发达的鳍结构相关,如 Cichlidae 中的 Aequidens、Geophagus 或 Loricariidae 中的 Hypostomus)的物种与轮廓较小、更对称的物种区分开来。PC3(贡献率 12.5%)与 Zernike moment 1 最相关,对比了更深、更圆的身体形状(常伴有背鳍丝状突起,如 Gasteropelecus spp.)与更流线型的形状(如 Triportheus spp.)。PC4(贡献率 11.5%)则主要与 Zernike moment 3 相关,将具有鳍延伸(如尾鳍丝)的流线型物种与极度细长的物种分离开。
形态空间分析表明,哥伦比亚淡水鱼类由一个主要的高密度节点主导,意味着大多数物种共享一个常见的体型:中等大小、侧扁或背腹扁平、大致呈椭圆形的身体,具有中等的对称性和鳍发育程度。这一核心形态型主要由 Characiformes、Siluriformes、Atheriniformes 和 Blenniiformes 的物种构成。同时,不同目级类群在形态空间中的占据模式各异。Synbranchiformes 高度集中在表征细长体型的象限。Blenniiformes 主要位于与更圆润、更深、更对称体型相关的象限。而物种最丰富的 Characiformes 和 Siluriformes 则广泛分布在多个象限,显示出极其广泛的形态多样性,涵盖了从深体、鳍发达到高度流线型、细长型,乃至背腹扁平装甲型等多种形态。
本研究成功地将人工智能驱动的图像分割技术应用于淡水鱼类形态多样性研究,首次基于活体野外照片构建了哥伦比亚淡水鱼类的结构化形态空间。该方法利用 SAM 模型的零样本分割能力,实现了超过 97% 的高精度分割,显著降低了人工标注成本,为大规模形态计量分析提供了可行方案。研究结果揭示了哥伦比亚淡水鱼类存在一个共享的主体形态模式,同时不同目级类群展现出独特的形态适应,特别是 Characiformes 和 Siluriformes 呈现出极高的形态分异度。这些形态差异与运动功能(如持续游泳效率与爆发加速及机动性的权衡)和栖息地利用密切相关,印证了经典鱼类生态形态学理论在哥伦比亚淡水生态系统中的适用性。该非侵入性、标准化的形态监测方法为未来生物多样性评估、功能性状分析、进化生态学研究以及生态系统监测提供了强大工具。未来的研究方向应包括扩大物种和地理区域的覆盖范围,整合更多局部性状(如眼位、齿式、鳍形态),并探索三维形态分析以捕捉背腹 Relief 等额外形态轴上的变异。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号