基于卷积神经网络的南极小须鲸生物鸭声信号跨海域自动检测研究及其声景适应性分析

《Marine Mammal Science》:Machine Learning Methods for the Detection of Antarctic Minke Whales (Balaenoptera bonaerensis) in East Antarctica and Western Australia

【字体: 时间:2026年01月08日 来源:Marine Mammal Science 1.9

编辑推荐:

  本研究开发了一种定制化的卷积神经网络(CNN)探测器,用于在南极东部和西澳大利亚的多种海洋声景中稳健检测南极小须鲸(Balaenoptera bonaerensis)发出的多变“生物鸭”(bio-duck)叫声。该探测器在9个地理分布迥异的数据集上表现出强大的泛化能力,其性能差异主要受信噪比(SNR)影响,高纬度站点(如赫德岛)表现优异(AUC-PR>0.9),而在工业化程度高的皮尔布拉地区性能相对较弱。研究通过比较目标信号与环境噪声的频带平均功率谱密度(PSD)水平,揭示了声景变异性对探测器效能的关键作用,为南极小须鲸的被动声学监测(PAM)提供了高效工具,并推动了跨海域大规模生态声学监测的自动化进程。

  
南极小须鲸(Balaenoptera bonaerensis)栖息于遥远且难以接近的南大洋环境,对其进行长期监测是生态学研究的重要挑战。自20世纪70年代以来,一种被称为“生物鸭”(bio-duck)的神秘声音在南大洋被多次记录,直至2014年才被确认为南极小须鲸的叫声。此后,研究发现在不同海域存在超过20种生物鸭叫声的变体,这些变体在脉冲间隔、脉冲数量和是否伴有频率调制下降扫频等方面存在差异。这种高度的声学多样性以及南极小须鲸分布海域环境噪声的巨大差异,对传统声学监测方法构成了挑战。本研究旨在开发一种基于机器学习的自动化探测器,以实现在东 Antarctica 和西澳大利亚等多种海洋声景中稳健检测南极小须鲸生物鸭叫声的目标。
2 方法
2.1 检测器开发数据集的创建
研究使用的被动声学监测(PAM)数据来源于澳大利亚南极局(AAD)、综合海洋观测系统(IMOS)的声学动物追踪数据库以及科廷大学海洋科学技术中心(CMST)。数据覆盖9个地理站点,纬度范围从南纬19.38°到66.57°,时间跨度从2005年至2019年。为进行检测器开发和测试,从每个站点每月的数据中随机抽取音频文件,最终用于训练和测试的音频总时长分别约为382小时和98小时。
所有音频文件均由专家观察员使用Raven Pro 1.6软件进行人工标注。标注时,将间隔小于或等于5秒的相邻脉冲序列注释为一个连续的生物鸭叫声事件,以保持其行为完整性。标注过程中遇到了多种已知的生物鸭叫声变体,包括双脉冲、包含10个脉冲的系列叫声以及伴有下降扫频的脉冲。
2.2 南极小须鲸生物鸭叫声检测器
检测器基于深度学习框架Koogu(v0.7.2)构建,采用了一种准DenseNet卷积神经网络(CNN)架构。该架构包含四个密集块,每个块有四层,增长率k=8。输入音频首先下采样至1000 Hz,并经过一个50-250 Hz的9阶巴特沃斯带通滤波器。随后,音频被分割成10秒的片段,并生成频谱图用于训练。为平衡类别并加速训练,从每个类别(‘BD’代表生物鸭叫声,‘other’代表其他噪声)中随机选择50,000个频谱图作为输入。网络训练共进行50个周期,并采用了dropout率为0.05的策略以防止过拟合。
2.3 性能评估
检测器性能通过精确度-召回率(PR)曲线、曲线下面积(AUC-PR)、F1分数以及每小时误报数(FP/h)等指标进行评估。评估按站点和季节(夏季:12月至次年5月;冬季:6月至11月)分别进行,以考察冰盖变化导致的声景差异对性能的影响。误报样本被进一步分类为人为噪声、非生物噪声和其他生物噪声来源。
2.4 目标信号水平与环境噪声水平分析
为探究检测器性能差异的原因,研究计算了目标信号(生物鸭叫声标注期间)和环境噪声(标注外时间)在50-250 Hz频带内的平均功率谱密度(PSD)水平。通过非参数统计检验(克鲁斯卡尔-瓦利斯检验和曼-惠特尼U检验)分析了不同纬度(高纬度≥45°S,低纬度<45°S)和不同季节对频带平均PSD水平的影响。
3 结果
3.1 标注与模型性能
测试数据集共包含509个专家标注的生物鸭叫声事件。高纬度站点(如普里兹湾、凯西站、南凯尔盖朗海台)的标注数量远多于低纬度站点(如皮尔布拉、珀斯峡谷)。季节性上,低纬度站点仅在冬季有生物鸭叫声出现,而高纬度站点则在冬夏两季均有出现,但冬季数量通常更多。
检测器整体表现良好,综合所有站点的加权平均AUC-PR为0.84,最大F1分数为0.81。然而,性能存在明显的站点和季节差异。高纬度站点(如赫德岛AUC-PR=0.99,南凯尔盖朗海台AUC-PR=0.96)的性能普遍优于低纬度站点(如皮尔布拉AUC-PR=0.60)。冬季的性能(AUC-PR=0.92,最大F1分数=0.89)也显著优于夏季(AUC-PR=0.79,最大F1分数=0.73)。精确度-召回率曲线和FP/h分析显示,检测器在召回率达到约0.75时仍能保持高于0.7的精确度,同时FP/h控制在20以下。
误报分析表明,在工业化程度高的皮尔布拉和珀斯峡谷站点,误报主要来源于地震空气枪、船只噪声等人为活动,以及座头鲸(Megaptera novaeangliae)歌声和小须鲸(Balaenoptera acutorostrata)“boing”叫声等生物信号。在所有站点,非南极小须鲸产生的下降扫频叫声也是常见的误报来源。
3.2 目标信号与环境噪声的频带平均PSD水平
统计检验表明,纬度和季节对频带平均PSD水平均有极显著影响。高纬度站点在夏季的环境噪声PSD水平显著高于冬季,而低纬度站点的季节性差异较小或趋势相反。在高纬度站点的冬季,目标信号的PSD中位数通常高于或等于环境噪声的中位数,而在夏季或低纬度站点的冬季,环境噪声水平往往更高,导致信噪比(SNR)降低。性能较差的站点(如普里兹湾、皮尔布拉)其目标信号与环境噪声的PSD水平分布重叠度较高,SNR条件不利。
4 讨论
本研究成功开发了一个CNN机器学习检测器,能够跨越南极和澳大利亚西部多个地理声景区,稳健地检测多变的南极小须鲸生物鸭叫声。检测器性能的差异主要归因于各站点和季节不同的声学环境,特别是目标信号与环境噪声之间的信噪比(SNR)。高纬度南极站点受人为噪声污染少,且冬季环境噪声低,为检测提供了优越的声学条件。相反,低纬度站点常年存在船只交通、工业活动等噪声源,并且有其他鲸类(如座头鲸、小须鲸)发出频谱特征相似的叫声,增加了误报的风险,降低了检测精度。
研究表明,基于CNN的机器学习方法能够有效处理生物鸭叫声的固有变异性,并适应不同的环境噪声背景。尽管训练数据集规模有限,但检测器展现了良好的泛化能力。未来工作可考虑纳入更广泛的地理和声景数据,以进一步提升检测器在复杂噪声环境下的鲁棒性。此外,专家验证对于区分易混淆的鲸类叫声仍然是必要的谨慎步骤。
总之,该检测器为南极小须鲸的大规模、长期被动声学监测提供了一种高效、自动化的解决方案,有助于更好地了解这一物种的分布、丰度及其对快速变化的高纬度海洋环境的响应。这项工作也展示了机器学习在海洋哺乳动物声学监测,特别是在应对声景多样性和信号多变性挑战方面的巨大潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号