基于深度学习的深渊狮子鱼视频数据集构建与自动识别基准研究

【字体: 时间:2025年05月28日 来源:Deep Sea Research Part I: Oceanographic Research Papers 2.3

编辑推荐:

  本研究针对深海生态研究中极端环境下稀有物种自动识别的技术瓶颈,构建了首个6000米以下深渊狮子鱼(Pseudoliparis swirei)的标注视频数据集,通过YOLOv8模型结合注意力机制的消融实验,建立了定量化基准测试体系,并验证了模型在分布外数据中的泛化能力,为深海生物多样性评估提供了高效的AI解决方案。

  

在永恒黑暗、超高压(>6000米)的深渊环境中,透明无色的Pseudoliparis swirei(马里亚纳狮子鱼)作为"最深的脊椎动物"生存典范,其生态研究长期受制于传统人工视频筛查的低效性。尽管ROV(远程操作载具)技术已能获取深海影像,但现有计算机视觉系统面临三重挑战:94.2%体表透明度导致特征缺失、骨骼可变形性引发的形态学变异、以及深海成像固有的低对比度(<40dB)和强散射(>0.5/m)干扰。中国科学院深圳先进技术研究院团队在《Deep Sea Research Part I》发表的研究,首次构建了包含多尺度注意力机制的YOLOv8识别体系,为破解这些难题提供了新范式。

研究团队采用三阶段技术路线:首先通过载人深潜器获取马里亚纳海沟原始视频数据,经专家标注构建含时空定位信息的基准数据集;随后设计包含CBAM(卷积块注意力模块)和ECA(高效通道注意力)的YOLOv8变体进行消融实验;最终采用OOD(分布外)数据验证模型泛化性。特别针对P. swirei的形态特殊性,创新性地将骨骼柔韧性参数转化为数据增强策略。

【Description of YOLO】章节揭示,研究选用单阶段检测框架YOLOv8,其优势在于将检测任务转化为回归问题,通过7×7网格实现多尺度预测,在保持mAP(平均精度)>0.85时推理速度达45FPS。针对透明体表特征,模型引入跨阶段特征金字塔结构,有效捕捉不同透明度层级(71.9%-89%)的颅骨残基特征。

【Metrics for model performance】部分详细说明评估体系:在k+1类分割任务中,定义pij为类别误判像素数,据此计算IoU(交并比)达0.91,F1-score为0.89。特别值得注意的是,对单色指数=0.97的样本,模型仍保持0.82的召回率,显著优于传统方法(0.63)。

【Discussion】指出集成SE(压缩激励)注意力模块的YOLOv8x版本表现最优,在OOD测试中将人工筛查效率提升17倍。模型成功识别出骨骼质量减少60%的极端个体,证实其对形态变异的鲁棒性。但研究也发现,当遇到日本海沟同属物种P. belyaevi(单色指数=0.8)时,识别准确率下降12%,提示未来需扩大跨物种训练数据。

【Conclusion】强调该研究实现了三大突破:建立首个深渊专属生物视觉基准、验证注意力机制在极端环境识别的有效性、开发出可迁移至其他深海物种的框架。这些成果不仅助力阐明P. swirei在8250米深度的生存机制,更为构建"数字深海"生态系统监测网络奠定技术基础。正如作者所述,这项工作的真正价值在于"将人类对深渊的认知速度提升到与ROV下潜速度同步的水平"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号