
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于声学特征的开放与封闭鸟类种群个体识别研究及其生态监测应用
【字体: 大 中 小 】 时间:2025年07月23日 来源:Ecological Informatics 5.9
编辑推荐:
研究人员针对野生动物个体追踪中传统标记技术的局限性,创新性地开展基于被动声学监测(PAM)的生物声学个体识别研究。通过构建两个新型数据集和迁移学习方法,验证了预训练物种分类模型(BirdNET/Google-Perch)在封闭集(已知个体)和开放集(含未知个体)识别任务中的卓越性能,AU-ROC达93.59%,首次实现深度学习在野生动物声学个体OOD(分布外)分类中的应用突破,为无创种群动态监测提供关键技术支撑。
在野生动物保护领域,传统的个体标记技术如鸟类环志(bird banding)和肢体剪裁(appendage clipping)存在操作侵入性强、成本高昂等缺陷。尤其对于长寿物种,标记持久性更成为难以逾越的技术瓶颈。尽管近年来非侵入式识别技术如照片识别和eDNA分析崭露头角,但生物声学监测凭借其设备部署简便、数据获取连续等优势,正逐渐成为个体追踪研究的新范式。
这项发表于《Ecological Informatics》的研究创新性地将深度学习引入生物声学个体识别领域。研究团队通过采集红尾黑凤头鹦鹉(Calyptorhynchus banksii graptogyne)和小企鹅(Eudyptula minor)的新型声学数据集,并结合已有的角鸮(Athene noctua)、树鹨(Anthus trivialis)和叽喳柳莺(Phylloscopus collybita)数据,系统评估了三种卷积神经网络(CNN)模型在封闭集和开放集场景下的个体识别性能。研究首次证实预训练物种分类模型的特征提取器可成功迁移至个体识别任务,为解决野生动物种群动态监测中的"新个体发现"难题提供了关键技术方案。
关键技术方法包括:1)采用AemNet端到端架构处理原始音频,结合时间掩蔽和随机增益增强数据;2)利用BirdNET和Google-Perch预训练模型进行特征迁移;3)引入最大软max概率(MSP)和简化Hopfield能量(SHE)两种分布外(OOD)检测方法;4)采用熵开放集损失(EOS)提升模型对未知个体的识别能力。所有实验均通过五折分层交叉验证确保结果可靠性。
在封闭集分类任务中,所有模型对五个物种均表现出优异性能,其中BirdNET在小企鹅和小角鸮的识别准确率分别达97.03%和97.59%,显著优于定制模型。值得注意的是,尽管预训练过程中个体差异信息被有意忽略,迁移学习仍展现出强大的特征泛化能力,这表明物种分类所需的声学特征与个体识别存在内在关联。
开放集分类结果更为引人注目:当引入ESC-10数据集作为负样本进行EOS训练后,BirdNET在红尾黑凤头鹦鹉数据上取得93.59%的AU-ROC和92.66%的开放集分类率(OSCR),验证了预训练模型处理未知个体的卓越能力。研究还发现模型性能与叫声复杂度呈负相关,树鹨多音节鸣唱的OOD识别表现相对较弱,暗示现有固定长度输入架构在捕捉长程声学模式方面存在局限。
该研究在方法论层面取得三项重要突破:首先,首次将深度迁移学习成功应用于生物声学个体OOD分类,为动态种群监测提供可行方案;其次,证实负样本训练能显著提升模型开放集识别能力,建议实地研究中同步采集未标记个体数据;最后,构建的两个新型声学数据集填补了特定物种个体声纹研究的空白。这些发现不仅推动了计算生态学与保护生物学的学科交叉,更为濒危物种普查、栖息地评估等实际应用开辟了新途径。未来研究可探索深度聚类等技术,进一步实现基于声学特征的种群数量估算,最终建立完整的"声学标记-重捕获"监测体系。
生物通微信公众号
知名企业招聘