编辑推荐:
为解决入侵物种监测难题,尤其是蔗蟾蜍(Rhinella marina)的监测问题,研究人员利用被动声学监测(PAM)和机器学习算法开展研究。结果显示,所开发的工具检测准确率超 90%,该研究为生物多样性监测、入侵物种防控提供有力支持。
在生物多样性保护的大战场上,入侵物种可谓是 “头号劲敌”。它们悄无声息地跨越地理界限,肆意破坏当地生态系统的平衡,给全球生态环境带来了沉重打击。就拿蔗蟾蜍来说,自 1935 年入侵澳大利亚后,迅速在北部地区扩散,横跨多个州,所到之处,本土生物苦不堪言。蔗蟾蜍被列为世界百大最恶劣入侵物种之一,它繁殖能力超强,还能分泌毒液,许多本土动物因误食而丧生,对澳大利亚的生物多样性造成了深远的负面影响。
传统的监测手段在面对蔗蟾蜍这类入侵物种时,往往力不从心。而被动声学监测(PAM)技术的出现,本为入侵物种监测带来了新希望。PAM 通过声学记录仪捕捉环境声音,以此来追踪物种踪迹,具有成本低、可连续监测等优点,特别适合在偏远地区发挥作用。但它也面临着难题,那就是数据量巨大,靠人工分析根本不现实,而现有的自动化声音检测和分类工具又少之又少,且适用性有限,难以满足实际需求。在这样的背景下,开发一种高效、精准且通用的蔗蟾蜍监测工具迫在眉睫。
为攻克这一难题,来自国外的研究人员踏上了探索之旅。他们的研究成果发表在《Ecological Informatics》上,为入侵物种监测领域带来了新曙光。
研究人员在这项研究中,主要运用了以下关键技术方法:
一是利用澳大利亚声学观测站(A2O)提供的大陆尺度音频数据集,该数据集涵盖了多个生态区域,为研究提供了丰富的样本。
二是选用了 BirdNET 算法,这是一种卷积神经网络(CNN)架构,能够通过分析频谱图中的视觉模式识别声学事件,且操作简单,适用性广。
三是借助 R 语言的monitoR包和 Python 的相关模块,进行数据处理、模型训练和分析。
下面让我们来看看具体的研究结果:
初步性能评估:研究人员用训练好的分类器对 9 个地点的 20 个两小时录音进行分析。结果发现,分类器能成功检测到蔗蟾蜍的鸣叫,在 11 个实际有蔗蟾蜍活动的录音中,正确检测出 9 个,不过也遗漏了 2 个活动极少的录音。在不同时间分辨率下进行评估,精度在所有测试尺度上都超 95%,从两到五分钟的时间尺度起,甚至能达到完美精度,没有误报;召回率方面,在所有置信水平下至少能检测到 30% 的蔗蟾蜍叫声,在 15 - 30 分钟的时间间隔内可提升至约 75% 。
分类器时空性能:对 40 个 A2O 站点近 89 年的录音分析后,分类器识别出超 350 万次蔗蟾蜍检测。经验证,26 个站点有蔗蟾蜍存在。研究发现,置信分数与预测准确率呈正相关,整体上,最高置信分数(0.99)时准确率超 80% 。但不同站点间准确率差异较大,部分站点可达 100%,而有些站点即使在高置信分数下准确率也较低。此外,湿季的预测准确率比干季更高,部分站点还存在季节性差异。
检测性能使用时间序列聚合特征:考虑到蔗蟾蜍长时间鸣叫的特点,研究人员运用时间序列聚合特征优化检测。通过条件推断树(CIT)模型确定的优化阈值,在精度、召回率和模型性能上都优于通用阈值。例如,在三秒级别,优化阈值的精度比最高精度的通用阈值(UNI90)提高了 14.1%,召回率比 UNI50 提高了 21.3% 。而且,优化阈值在确定蔗蟾蜍存在与否时,能显著减少误报,提升检测性能。
综合研究结果和讨论部分,这项研究意义非凡。研究人员开发的蔗蟾蜍声学分类器,整个流程使用的工具和数据都是免费的,具有很高的性价比和可及性,为其他入侵物种分类器的开发提供了参考范例。该分类器在不同时间尺度下都有较高的精度和召回率,结合时间聚合特征后,更是大大降低了误报率,能有效满足不同研究目的需求。虽然在空间性能上存在一些不足,受训练数据覆盖范围的影响,在某些生态区域表现欠佳,但后续可以通过补充数据来改进。
从更长远的角度看,这个分类器不仅能用于监测蔗蟾蜍的分布,还有助于深入研究其繁殖生态、对本地物种的影响等。比如通过分析其鸣叫活动,能找出繁殖热点区域和栖息地偏好,为制定更有效的防控策略提供科学依据。同时,将其应用到其他蔗蟾蜍入侵地区,与当地研究人员合作,能进一步检验和提升其性能,为全球入侵物种监测和生态保护事业添砖加瓦。