巧用两阶段模型优化野生动物研究中的机器学习分类器:以减少披肩鸡误判为例

【字体: 时间:2025年05月08日 来源:Ecological Informatics 5.9

编辑推荐:

  在野生动物监测中,机器学习(ML)分类器的误报会误导生态模型。研究人员以披肩鸡为研究对象,运用两阶段建模方法分析相关声学数据。结果显示该方法能有效识别误报,提升模型性能。这为野生动物研究提供了更精准的监测手段。

  在野生动物监测领域,传统的人工监测方式不仅耗时费力,还难以覆盖广阔的地理区域和长时间的监测周期。随着科技的进步,被动声学监测(PAM)技术应运而生。它借助自主录音单元(ARUs),能够持续或按固定计划记录声音数据,为野生动物研究提供了丰富的信息来源。与此同时,机器学习(ML)技术的发展,使得从海量的声学数据中自动检测目标野生动物信号成为可能。然而,ML 分类器存在的误报问题却给野生动物研究带来了困扰。误报会导致生态模型出现偏差,进而影响野生动物的管理和保护决策,使得这些努力可能误入歧途。
为了解决这一问题,来自国外的研究人员开展了一项针对披肩鸡(Bonasa umbellus)的研究。披肩鸡是北美本土的一种猎鸟,由于森林成熟化和西尼罗河病毒的传播,其种群数量呈下降趋势,因此对其进行有效监测至关重要。研究人员运用两阶段建模方法,对两种开源模型(BirdNET 和击鼓模型)进行分析,旨在减少披肩鸡检测中的误报,提高检测准确性。该研究成果发表在《Ecological Informatics》上,为野生动物监测领域提供了新的思路和方法。

研究人员主要运用了以下关键技术方法:首先,部署 ARUs 在佛蒙特州的格林山国家森林收集声学数据。其次,利用 BirdNET 和击鼓模型对数据进行分析,BirdNET 是一种深度学习模型,通过卷积神经网络(CNN)对音频片段进行分类;击鼓模型则运用信号处理技术检测披肩鸡的击鼓声音。然后,对模型检测结果进行人工验证,标记为真阳性或假阳性。最后,使用逻辑回归构建二级模型,以识别和去除一级模型产生的误报。

研究结果如下:

  • 目标 1:BirdNET 和击鼓模型的检测率:研究期间共收集了超过 9500 小时的录音。BirdNET 检测到 524 次披肩鸡(包括真阳性和假阳性),其检测的置信度分数在 0.10 - 0.99 之间,中位数为 0.25。击鼓模型在 2023 年的数据中检测到 4106 次(包括真阳性和假阳性),序列长度在 9 - 32 之间,持续时间在 1.1 - 6.9 秒之间。两种模型的检测率在日期和时间上均有所不同。击鼓模型在早上 5 点 - 6 点检测率最高,每小时有 2.0 次检测(1.6 次真阳性检测);BirdNET 在晚上 18 点检测率最高,每小时有 0.10 次检测(0.063 次真阳性检测)。从季节上看,击鼓模型的检测率在 4 月逐渐增加,在 4 月 24 日那周达到峰值;BirdNET 的检测率则较低,一直持续到 8 月中旬。此外,BirdNET 检测到的真阳性中,约一半是 “吠声”,四分之一是 “咯咯声”;击鼓模型仅检测 “鼓声”,且约 71% 为真阳性。
  • 目标 2:评估误报率:通过逻辑回归分析发现,击鼓模型的真阳性率总体上显著高于 BirdNET。对于击鼓模型,早上真阳性检测的概率最大(最大似然估计 MLE = 0.75);而 BirdNET 在晚上的真阳性检测概率最大(MLE = 0.34)。这表明时间对两种模型的真阳性率影响不同。
  • 目标 3:用于去除误报的二级模型:针对 BirdNET 检测结果,以置信度分数为预测变量构建的二级逻辑回归模型,准确率达到 84.5%,与交叉验证准确率 84.4% 相匹配,且通过了所有拟合优度检验。结果表明,置信度分数对真阳性检测概率有显著的正向影响。对于击鼓模型,从其输出中提取 5 个候选特征构建二级模型,经筛选,最终模型包含 log (cor (y)) 和 min (y) 两个预测变量,模型准确率为 89.8%,与交叉验证准确率相同,且通过了所有拟合优度检验。该模型显示 log (cor (y)) 对真阳性击鼓检测概率有显著负向影响,min (y) 有显著正向影响。
  • 目标 4:评估两阶段方法:通过绘制精度召回曲线和 F1 分数曲线评估两阶段方法。结果显示,增加阈值 θ 会提高精度但降低召回率。BirdNET 在 θ = 0.45 时达到最大 F1 分数 0.47;击鼓模型在 θ = 0.45 时达到最大 F1 分数 0.93,且在 0.00 - 0.90 的 θ 值范围内,F1 分数变化较小。此外,BirdNET 和击鼓模型的受试者工作特征曲线下面积(AUROC)分别为 0.75 和 0.94,精度召回曲线下面积(AUPRC)分别为 0.46 和 0.97。

研究结论和讨论部分指出,该研究评估了两种开源模型对披肩鸡的检测能力,展示了两阶段方法在提高模型性能方面的有效性。两种模型在检测时间和检测的发声类型上存在差异,反映了它们捕捉披肩鸡不同生活史相关声学信号的能力。两阶段建模中的二级模型能够有效识别误报,但在选择阈值时需要权衡精度和召回率,这取决于具体的研究目标。与参数优化相比,两阶段建模提供了一种标准化的方法,无需更改原始模型,更易于生态学家应用。尽管该研究存在一定局限性,如结果可能无法推广到其他数据集,但为改进基于 ML 的物种分类模型提供了重要信息,有助于更准确地评估披肩鸡种群的状况和趋势,也为其他野生动物监测研究提供了可借鉴的方法和思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号