复杂声景中濒危库克湾白鲸的自适应声学监测

《Marine Mammal Science》:Adaptive Acoustic Monitoring for Endangered Cook Inlet Beluga Whales in Complex Soundscapes

【字体: 时间:2026年06月09日 来源:Marine Mammal Science 1.9

编辑推荐:

  濒危库克湾白鲸(Delphinapterus leucas)的有效保护需要全面的时空数据,然而监测工作在空间上存在偏差,低估了重要的南部栖息地。被动声学监测(PAM)提供了所需的大范围覆盖,但其扩展带来了显著的计算挑战,包括高声景变异性、目标物种信号相对于背景

  
濒危库克湾白鲸(Delphinapterus leucas)的有效保护需要全面的时空数据,然而监测工作在空间上存在偏差,低估了重要的南部栖息地。被动声学监测(PAM)提供了所需的大范围覆盖,但其扩展带来了显著的计算挑战,包括高声景变异性、目标物种信号相对于背景噪声的稀有性,以及多物种信号干扰,这些可能损害分类器性能。研究人员提出了一个开源深度学习框架,旨在提高对该种群PAM分析的鲁棒性、适应性和领域泛化能力。基于一个以白鲸为中心的二元分类器,研究人员实现了一个将信号检测与物种分类分离的双阶段模型,并将框架扩展到包括虎鲸(Orcinus orca)和座头鲸(Megaptera novaeangliae)的多物种情境。研究人员使用对比音频-语言模型高效地增加了对先前代表性不足物种的标注覆盖,同时主动学习实现了对新数据模型性能的迭代优化。该框架被应用于下库克湾管理和生态重要区域的PAM数据集。结果表明,稀有物种出现的检测得到改善,每日白鲸存在估计的置信度提高,从而加强了PAM在指导恢复工作和管理决策中的作用。这种可迁移的工作流程支持大规模、长期海洋哺乳动物监测项目的持续进步。
**研究背景、问题与目的**
库克湾白鲸(Delphinapterus leucas)作为濒危物种,其恢复缺乏明确原因。以往研究主要集中在春夏季北部范围(夏季栖息地),但秋冬季节占据的南部范围(冬季栖息地)研究不足。被动声学监测(PAM)虽能提供大范围覆盖,但随着监测扩展面临计算挑战:声景变异性高、目标信号稀有、多物种信号干扰导致分类器性能下降。现有二元检测模型难以适应空间扩展、传感器变化(领域漂移)以及新增的虎鲸(Orcinus orca)和座头鲸(Megaptera novaeangliae)信号识别需求。为此,研究人员旨在开发一个自适应、开源深度学习框架,提高PAM分析的鲁棒性、准确性和可扩展性,支持多物种分类,并通过主动学习实现领域适应。论文发表在《Marine Mammal Science》。

**主要关键技术方法**
研究人员采用以下关键技术:(1)双阶段深度神经网络(DNN):第一阶段用ResNet-18进行广义鲸类信号二元检测,第二阶段用ResNet-34进行物种分类(白鲸、虎鲸、座头鲸及噪声类);(2)对比音频-语言预训练(CLAP)模型:通过零样本文本提示高效扩展虎鲸和座头鲸的标注样本;(3)主动学习循环:专家审查低置信度预测并修正,迭代微调模型以适应新领域(Tuxedni Channel和Johnson River数据集);(4)重叠推理滑动窗口策略:2秒窗口间隔400毫秒滑动,提供自然数据增强。样本队列来源包括CIBA项目2008-2023年间多个部署点的PAM数据,以及2019年Chinitna和Iniskin湾的连续录音数据。

**研究结果**
*4.1 基于CLAP的标注*
通过对文本提示的测试和微调,发现间接语义描述(如“distant tones”“unrecognizable shouts”)比直接语义提示(如“humpback whale calls”)更有效,分别从3个月连续录音中获得了1266个虎鲸和1322个座头鲸标注,显著平衡了不同物种的标注比例。

*4.2 基模型性能*
在测试集上,单阶段四类模型与两阶段模型(二元+三类、二元+四类)性能相近,但二元+三类配置在保持精度相近的情况下获得了稍高的白鲸召回率(0.963),这是研究的主要关注点。

*4.3 主动学习结果*
主动学习显著提升了Tuxedni Channel和Johnson River数据集上的性能。在Tuxedni Channel,白鲸的F1分数从0.65提升至0.70,主要由于假阳性减少;在Johnson River,虎鲸的召回率从0.01跃升至0.81,F1从0.02提升至0.74。同时,模型暴露了海鸭叫声和海冰压力噪声导致的假阳性问题。

*4.4 与旧结果的比较*
与先前CIBA分析流程(Lammers et al. 2013;Castellote et al. 2024)相比,新模型在Johnson River数据集中额外检测到3个白鲸和18个虎鲸出现事件,使记录物种存在次数分别增加2.5倍和约2倍;在Tuxedni Channel中,新模型识别了所有先前报告的白鲸检测中的绝大多数(仅漏3个检测正小时),并新增17个1月、13个2月和32个3月的检测正小时。

**讨论与结论**
讨论指出,双阶段架构结合CLAP和主动学习有效捕获了稀有声学信号,并适应不同声景环境。但模型对海鸟信号和冰噪声敏感,导致假阳性;未来可引入噪声类进行硬负样本训练。尽管存在局限,新流程在检测稀有物种和抵抗领域漂移方面显著优于旧方法,有助于管理决策和评估潜在捕食压力。

结论部分翻译如下:本研究提出了一个自适应、开源深度学习框架,通过提高分析可扩展性、领域泛化能力和多物种检测能力,改进了濒危库克湾白鲸的被动声学监测。从二元流程转向两阶段多类工作流程,展示了如何在高度不平衡和声学变化的数据集中优先确保稀有物种检测的灵敏度,同时控制分类不确定性。零样本对比音频-语言模型的集成高效扩展了额外鲸类物种的训练数据,突显了基于文本提示的标注策略的潜力与当前局限。主动学习在提升未见数据性能、减少假阳性以及揭示声景特定挑战方面至关重要,这些挑战在全自动化流程中会被掩盖。这些发现强调了迭代的人机交互对方法鲁棒性和生态可解释性的重要性。应用于库克湾白鲸关键栖息地时,该框架增强了PAM分析在支持保护决策中的可靠性和效率。更广泛地,该方法高度可迁移,为随着数据量、物种复杂性和管理需求增长而现代化大规模海洋哺乳动物声学监测提供了实用路径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号