高效的掩码自动编码器在鸟鸣信号表示中的应用,以及其在野生鸟类物种分类中的潜力

《Integrative Zoology》:Efficient Masked Autoencoder for Birdsong Representation with Applications on Wild Bird Species Classification

【字体: 时间:2025年11月23日 来源:Integrative Zoology 3.7

编辑推荐:

  这是中文摘要: 鸟类的多样性监测对生态保护至关重要,但传统方法依赖人工标注且在噪声环境中表现受限。本文提出CResMAE-BirdNET模型,结合对比学习和掩码自动编码器,引入时间-频率自校准融合模块(TFSC)抑制环境噪声,并通过改进的Sparrow搜索算法优化网络深度。实验表明,该模型在自建40类鸟鸣数据集(Bird40Song)和公共数据集(Birdsdata)上的准确率分别达到99.35%和98.43%,F1分数超99%,显著优于现有方法。

  在自然界中,鸟类不仅是生态系统的重要组成部分,还承担着生物多样性的指示角色。然而,传统的鸟类行为观察方法存在诸多限制,尤其是在复杂和嘈杂的自然环境中,鸟类鸣叫的识别常常面临噪声干扰和数据标注成本高等问题。为了解决这些挑战,研究团队提出了一种名为CResMAE-BirdNET的自监督学习模型,旨在通过自动提取未标注音频数据中的特征,提高鸟类鸣叫识别的准确率和鲁棒性。该模型结合了自监督学习和对比学习的优势,采用了残差注意力机制和残差多层感知机,有效提升了模型在捕捉局部与全局特征关系方面的表现,从而获得更高质量的特征表示。

CResMAE-BirdNET的核心思想是通过时间–频率自校准融合模块(TFSC)和自监督学习框架的结合,提升模型对自然环境中鸟类鸣叫信号的处理能力。TFSC模块能够有效提取时间–频率特征,并增强鸟类鸣叫谱图中的波动信息,减少环境噪声的干扰。这种模块设计不仅提升了模型对噪声的鲁棒性,还使模型在复杂环境下的表现更加稳定。此外,通过引入自监督学习方法,模型能够在没有人工标注数据的情况下,对大量原始音频进行特征学习,从而减少数据标注的负担,提高识别效率。

为了验证CResMAE-BirdNET的有效性,研究团队构建了一个包含40种鸟类鸣叫的自建数据集(Bird40Song),并结合了多个公开数据集(如Birdsdata)进行实验。实验结果显示,CResMAE-BirdNET在Bird40Song数据集上达到了99.35%的识别准确率和99.34%的F1-score,在Birdsdata数据集上分别达到了98.43%和98.28%。这些结果表明,CResMAE-BirdNET在自然环境中的鸟类鸣叫识别任务中表现优异,具有显著的提升效果。

为了进一步提升模型的泛化能力,研究团队还采用了多种数据增强方法,包括音调移位、环境噪声添加、峰值归一化和谐波失真等。这些方法不仅能够扩大数据集的规模,还能够模拟真实环境中的各种干扰因素,使模型在复杂环境中也能保持较高的识别准确率。实验结果表明,音频数据增强方法比基于图像的增强方法更能保留原始信号的特征,因此在鸟类鸣叫识别任务中表现更优。

此外,研究团队还对模型的结构进行了优化,通过引入改进的麻雀搜索算法(ISSA)来动态调整模型的编码器和解码器的深度配置,从而在保持高识别准确率的同时,降低模型的计算复杂度和参数数量。这种优化策略不仅提升了模型的训练效率,还增强了其在实际应用中的可扩展性。

在实验过程中,研究团队还对模型的多个组件进行了消融实验,以评估其对模型性能的影响。实验结果显示,TFSC模块和残差注意力机制的引入显著提升了模型的识别准确率和泛化能力,而ISSA算法的优化则进一步降低了模型的计算负担。这些实验结果表明,CResMAE-BirdNET在结构设计和训练策略上均优于现有方法,具有广泛的应用前景。

在实际应用方面,CResMAE-BirdNET不仅适用于实验室环境下的鸟类鸣叫识别,还可以部署在野外环境中的低功耗自动记录单元(ARUs)和移动设备上,实现对鸟类种群的长期监测和生物多样性研究。这种模型的部署不仅能够减少数据传输的需求,还能提供实时的鸟类识别结果,为生态保护和生物多样性研究提供重要的技术支持。

综上所述,CResMAE-BirdNET在鸟类鸣叫识别任务中表现出色,能够有效应对自然环境中的噪声干扰和复杂信号特征。通过结合自监督学习和对比学习的方法,该模型在识别准确率和泛化能力方面均优于传统方法。未来的研究将进一步优化模型的结构和训练策略,以适应更多样化的生态环境和鸟类种类,并探索其在大规模生态监测中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号