机器人辅助声学监测:无人机间歇采样策略在热带景观生物多样性评估中的应用与效能分析
《Remote Sensing in Ecology and Conservation》:Robotics-assisted acoustic surveys could deliver reliable, landscape-level biodiversity insights
【字体:
大
中
小
】
时间:2025年10月21日
来源:Remote Sensing in Ecology and Conservation 4.3
编辑推荐:
本综述创新性地探讨了无人机(UAV)间歇运动采样策略在声学生态监测中的应用潜力。研究基于哥斯达黎加奥萨半岛26,411小时的真实音频数据,通过模拟不同采样强度(UAV数量)与策略(随机、路径优化、自适应),系统评估了其对鸟类物种检测及蜘蛛猴栖息地占用的影响。结果表明,采样强度是决定数据质量的关键因素,而自适应策略并未显著提升物种检测率。该研究为未来利用自主无人机群进行大规模、低干扰的生物多样性监测提供了重要理论依据与技术路线图。
陆地遥感方法(如声学监测)可提供精细可靠的生物多样性数据。然而,调查的可扩展性往往受到传感器部署、维护和回收所需精力、时间和成本的限制。自主无人驾驶飞行器(UAV,或称无人机)正成为一种有前景的全自动数据收集工具,但其在生态学中的应用仍有很大发展空间。本研究探讨了一种基于无人机的声学监测新方法,是否能够检测哥斯达黎加多样化热带景观中的生物多样性模式。研究利用来自341个静态站点的26,411小时现有音频数据集,模拟了采用间歇性运动采样策略的无人机调查,并自动检测了19种鸟类(n = 1819)和蜘蛛猴(n = 2977)的发声。研究改变了单次调查中部署的无人机数量(采样强度)以及无人机在站点间的移动方式(随机移动、预定路线以最小化旅行时间、或根据实时检测自适应响应),并测量了对下游生态分析的影响。研究发现,鸟类物种检测和蜘蛛猴占用率不受采样策略影响,但采样强度对下游指标有强烈影响。虽然模拟的无人机调查能有效捕捉广泛的生物多样性趋势(如蜘蛛猴占用率和鸟类栖息地关联),但不适用于详尽的物种清单,因为在低采样强度下稀有物种常被遗漏。随着自主无人机系统和声学人工智能分析变得更为可靠和易用,本研究表明结合这些技术可大规模提供有价值的生物多样性数据。
陆地遥感方法相较于传统调查,为生物多样性监测提供了众多优势,提供了一种非侵入性且可扩展的生态系统研究方式。其中,声学监测在调查发声物种方面被证明特别有效,并显示出为生物多样性监测和政策合规工作做出贡献的巨大潜力。声学数据还可以使用机器学习进行快速分析,无论是事后分析还是实时分析。然而,部署声学传感器是一个耗时且昂贵的过程,调查地点可能受可及性或安全性 concerns 的限制。
无人驾驶飞行器(UAV),或称无人机,正在成为生态研究的变革性技术。通过使用附着在无人机上的传感器,这些设备可以提高可扩展性并减少与手动部署传感器相关的后勤限制。使用机载摄像头的航空影像是一种成熟的生态研究方法,但基于无人机的声学调查由于噪声干扰而不太常见。早期研究探索了将声学记录设备悬挂在飞行中记录的无人机上,使用定制分类算法在发动机噪声背景下检测动物发声。然而,无人机马达产生的噪声可能通过干扰野生动物来影响检测。另一种采样方法是部署一群带有车载传感器和处理器的机器人无人机,在记录期间降落,并按预定时间表在采样点之间移动。这种间歇移动采样方法可以减轻噪声相关干扰,并更接近被动声学监测(PAM)的调查设计,其中静态传感器优于 transect 调查,用于估算动物活动或密度。
以前的无人机声学调查使用手动驾驶的无人机。然而,自主无人机可以协调的“蜂群”形式部署,并自行导航以避免障碍物,这可以减少准入障碍,实现更精细分辨率和更大规模的生物多样性数据收集。已经开发出无人机原型来克服自动化声学调查的挑战,例如在树上栖息和在茂密森林环境中导航无人机蜂群。这些进步可以通过避免任何人员进入调查区域来减少对野生动物和环境的干扰。
自主无人机用于生态调查的部署代表了测试新颖调查设计的机会,这些设计无法通过手动传感器部署实现。无人机系统可以编程使用车辆路径算法来优化特定参数,例如减少所需充电次数。此外,自适应系统可以响应传感器的实时输入,这种方法已被自主水下车辆成功用于绘制水下漏油范围或定位浮游植物水华等任务。在生物多样性监测中,自适应采样策略已被用于检测环境梯度或提高占用模型准确性,但这些策略发生在多个调查周期内,并不响应实时动物检测。对于实时自适应采样如何影响生态数据的结构,以及这是否能产生与更成熟调查技术相媲美的可靠生物多样性度量,目前了解甚少。
设计基于无人机的声学调查存在独特的局限性,特别是在采样完整性方面。标准的PAM调查通常在每个采样点部署一个记录设备,所有设备在延长时间内同时记录。相比之下,无人机群的间歇采样意味着任何给定站点的记录持续时间都受到限制。由于某些动物发声具有时间依赖性,在不同独立站点在同一时间进行采样对于跨站点物种检测的稳健比较至关重要。目前尚不清楚不完整采样对关键生态指标的影响是否可以通过采样策略来抵消。解决这些差距对于理解基于无人机的声学监测相关的权衡,并帮助从业者选择满足其调查目标的最佳采样策略至关重要。
在本研究中,我们探讨由间歇采样协议导致的努力减少将如何影响下游生物多样性指标。我们利用哥斯达黎加奥萨半岛的声学数据集设计并运行了模拟无人机调查。该数据集先前已被用于测量鸟类多样性和蜘蛛猴占用率。利用这些研究的公开数据,我们模拟了由自主无人机网络执行的四种采样策略下的调查——随机、路径规划和两种类型的自适应采样。我们通过改变任务中部署的无人机数量(定义为采样强度)来评估每种策略的性能。通过复制原始研究中的关键分析,我们评估了间歇采样检测19种鸟类物种和估计蜘蛛猴在森林覆盖梯度上的占用率的能力。这项工作是第一个考虑基于无人机的声学调查全流程,并研究采样技术对下游生态指标影响的工作,为未来该技术在生态研究中的应用提供信息。
在我们的模拟中,我们使用了来自哥斯达黎加奥萨半岛一项大型PAM调查的两个开源数据集的物种发声检测。奥萨半岛位于哥斯达黎加南太平洋沿岸,包含生物多样性的热带常绿阔叶低地雨林,镶嵌着牧场、种植园和城市中心。
我们选择这个数据集进行无人机模拟是因为其采样设计。由于可及性限制,无法在整个调查区域(1093平方公里)实现均匀采样设计。相反,创建了一组采样组,表现为“集群”。这模拟了机器人无人机调查的采样设计,即无人机从中央充电站出发,前往充电站设定半径内的记录位置。数据集包含来自35个集群中341个站点的记录,每个集群平均有8.7个采样站点(范围[4, 28])。
采样站点在五种土地利用类别中分层,每个土地利用类别中放置的记录器数量代表其在整个区域的百分比覆盖度(由5米×5米 Landsat 5专题制图仪(TM)和 Landsat 8 操作陆地成像仪(OLI)确定)。土地利用类别为原始林、次生林、棕榈种植园、柚木种植园和草地。在每个采样集群,第一个记录器通过向随机方向行走500米放置,其余记录器放置至少相距500米,以最大化样本间的独立性。在可能的情况下,不使用小径;但在不可能的情况下,设备被放置在与小径垂直的最小距离200米处。记录设备也放置在距离栖息地边界最小200米处,以确保声音 solely 来自分类的栖息地。使用AudioMoth设备获取记录。记录器连续运行至少七天(范围[7, 16天]),以考虑不同日子的活动变异性并确保足够的采样努力。设备设置为在05:00–09:30、14:00–18:30和21:00–03:30的时间表记录,每天总计15小时。在这些时段内以48 kHz的采样率持续记录数据。采样在旱季(12月至8月)进行。最终数据集包括26,411小时的未压缩16位音频文件。
我们使用了Sethi等人提供的鸟类发声检测,他们使用开源鸟类发声检测模型BirdNET来识别音频数据中的鸟叫声。BirdNET是一个卷积神经网络(CNN),在来自许多在线呼叫库的鸟类发声上训练,以预测概率检测音频数据中的物种出现。Sethi等人启用了地理物种过滤器,并将模型置信度阈值设置为0.8。在本研究中,我们保留了19个物种的检测,模型能够以>90%的精度检测这些物种(即低误报率),基于经验丰富的当地鸟类学家对50个检测随机子集的验证。这导致在32个集群的126个站点上共有1819次鸟类检测。这19个物种仅代表奥萨半岛约465种鸟类中的一小部分,这是BirdNET训练数据集中地理和分类偏差的结果。需要注意的是,本研究对鸟类检测的分析并非旨在对奥萨半岛的鸟类多样性或分布做出结论,而是作为真实物种时空模式和动态的一个例子。
我们使用了Lawson等人提供的蜘蛛猴检测,他们训练了一个深度学习CNN来检测该物种的发声。Lawson等人手动注释了来自13个站点的561个蜘蛛猴发出的“whinny”发声示例。所使用的神经网络采用了深度CNN架构。所有蜘蛛猴检测都经过手动验证,以确保去除所有误报。最终数据集包含在341个站点中的64个站点上的2977个真阳性。这些检测被转换为每个站点7天的检测历史,每天编码为1或0,表示蜘蛛猴的存在或缺失。更精细时间分辨率的数据未发布,限制了我们蜘蛛猴数据集模拟的范围。
为了评估自主无人机系统可收集的数据,我们运行了模拟,从鸟类和蜘蛛猴数据集中收集数据。调查被设计为间歇移动采样,意味着数据收集(即声音记录)发生在无人机静止在站点时,以最小化飞行噪声对记录质量和动物干扰的影响。这种间歇运动可以通过降落到地面或在树冠上栖息来实现。所有模拟在Python 3中运行。
无人机功能基于商用多旋翼无人机DJI Mini 2。该设备在无负重情况下可实现约30分钟飞行时间。由于无人机会配备麦克风及相关硬件(约80克,包括独立电池),我们估计最大飞行时间为20分钟。电池消耗计算为飞行时间的函数。平均飞行速度设为15米/秒,每次起飞额外增加16秒惩罚,以考虑无人机增加高度带来的额外电池消耗。我们假设在静止和降落状态下,无人机不消耗电池。我们没有考虑风、温度和其他可能在实际场景中降低整体电池寿命的因素的影响,因为我们没有适当分辨率的数据。
模拟在采样集群级别运行。选择每个集群所有采样站点平均纬度和平均经度最接近的采样站点作为“充电站”。每个模拟开始时,所有无人机(配备麦克风的自主无人机)在第一个时间步位于充电站点。在每个连续时间步,无人机会移动到集群内的其他采样位置,并“收集”该时间步和位置真实音频数据集中的任何检测。鸟类数据集模拟的时间步长为1小时(每天15个时间步,范围7-16天),蜘蛛猴数据集模拟的时间步长为1天(总共7个时间步)。如果无人机没有足够电池既访问下一个选定站点又返回充电站,则无人机会被直接送回充电站。所有模拟重复50次,以考虑站点选择的随机性。
我们的模拟实验了两个参数:采样强度和采样策略。采样强度代表同时部署的无人机数量。我们使用了五个采样强度值(0.2, 0.4, 0.6, 0.8, 1),每个值代表无人机数量占集群中站点总数的比例。采样强度值为1,代表完全采样(即每个采样点一架无人机),相当于完整的静态PAM调查,用于基线比较。
采样策略定义了无人机在站点间路径的确定方式。我们创建了四种策略:随机、路径规划、自适应探索和自适应利用。
在随机采样策略中,下一个站点的选择通过随机选择(有放回)确定,允许连续时间步选择同一站点。已被其他无人机选中的站点从可用站点列表中移除,以避免同一时间多次访问同一站点。
对于路径规划采样策略,每个集群的采样站点使用k-means聚类基于其GPS坐标分组为地理上不同的子组,其中k等于无人机数量。每架无人机只会前往特定子组内的站点。在每个时间步,下一个站点的选择基于先前访问次数,优先选择采样最少的站点。在这些站点中,选择最近的可用站点。这种策略意味着在调查过程中,集群中的所有站点被平等访问,并且站点访问顺序保持相对一致,因为最近邻算法反复识别站点间相同的最短路径。
第三和第四种采样策略,自适应探索和自适应利用,考虑了一种场景,即无人机具有车载处理能力,可以实时检测动物发声,并自适应选择下一个站点。该策略仅针对鸟类群落数据集运行,因为该数据集时间分辨率更高。自适应采样可以以多种方式配置,取决于优化的度量,例如寻找梯度或增加占用置信度。在这里,我们选择优化采样努力以增加在每个集群中检测到所有存在物种的置信度。为了实现这一点,我们编程路径系统优先选择检测到更频繁鸟类发声率的站点,因为这些站点预计代表鸟类活动高的区域。在模拟的前2天(30个时间步),使用上述路径规划策略对站点进行采样,以确保所有站点的基线覆盖。30个时间步后,下一个站点的选择通过随机选择(有放回)决定,其中选择每个站点的概率由先前在该站点检测到的发声次数和总访问次数偏置。站点i的概率权重(P_i)确定为:P_i = (bias_i)^α / Σ_j (bias_j)^α,其中偏置bias_i计算为先前在站点i检测到的发声总数除以站点i的总访问次数,并通过所有可用站点的这些值之和进行归一化。α代表一个权重因子,决定高概率和低概率之间的差异。
我们测试了两个α值,以探索“探索性”自适应系统(α=1)和“利用性”自适应系统(α=5)之间的差异,前者实时检测对站点选择给予低偏置,后者实时检测对下一个站点选择给予高偏置。
模拟评估在R(V4.4.1)中进行。对于使用BirdNET检测数据集的模拟,我们测量了整个调查区域和每个土地利用类型(原始林、次生林、红树林、草地、棕榈种植园、柚木种植园)检测到的物种总数,并将这些值与完全采样(采样强度=1)收集的值进行比较。我们使用广义线性混合效应模型(GLMM)和泊松分布来确定采样策略(随机、路径规划、自适应探索和自适应利用)和采样强度对鸟类物种检测的影响。迭代次数作为随机效应纳入。
对于蜘蛛猴数据集,我们使用7天检测历史运行逻辑GLM,预测蜘蛛猴存在概率对森林覆盖的响应,复制了Lawson等人的分析。为了定义蜘蛛猴占用的最小森林覆盖阈值,我们使用接收者操作特征(ROC)曲线确定一个最大化预测阳性占用的特异性和敏感性的截断点。然后我们预测森林覆盖范围内的占用概率,并找到与截断概率相交的森林覆盖值,以获得最小森林覆盖阈值。该阈值不是检测到蜘蛛猴的最小值,更接近代表蜘蛛猴被持续检测到的森林覆盖值以上;因此,它考虑了较低森林覆盖区域中的异常检测。我们计算了每次模拟的最小森林覆盖阈值,并将其与完全采样(采样强度=1)的值进行比较。
为了展示改变采样策略和强度将如何影响基于无人机的调查设计的其他方面,我们测量了所有基于鸟类发声数据集模拟的采样均匀度、无人机总旅行时间和充电次数。
为了测量跨空间和时间的采样均匀度,我们计算了调查活动期间(05:00–09:30, 14:00–18:30和21:00–03:30, n=15小时)每个站点在每个小时的访问频率,并计算了每个集群的香农均匀度指数(SEI)。SEI值介于0和1之间,较高的值表示在一天中的小时之间对站点的访问更均等。我们计算了每个集群的SEI,并对每个采样策略和采样强度值的所有35个集群进行了平均。
平均总旅行时间通过汇总单个模拟中集群内所有无人机行驶的总距离计算,然后通过站点数量进行归一化,使得旅行时间在不同站点数的集群间可比。使用相同方法记录访问充电站的平均次数。
所有模拟都能够恢复BirdNET物种检测在不同土地利用类型中的模式,尽管物种丰富度随采样强度降低而减少。在所有采样强度值下,测量的物种丰富度始终在草地最高,其次是次生林、原始林、棕榈种植园、红树林和柚木种植园。采样策略(随机或路径规划)对测量的物种丰富度没有影响。
当检查所有站点的完整BirdNET物种检测列表时,采样强度<1的模拟无法 consistently 检测到最大物种丰富度(n=19物种),尽管一些在0.6和0.8采样强度的迭代确实检测到了最大物种丰富度。GLM结果显示,采样策略对测量的物种丰富度没有影响(p=0.58),但采样强度有强烈的积极影响(p<0.001)。
对于蜘蛛猴模拟,我们发现预测蜘蛛猴占用的最小森林覆盖阈值往往被高估且不确定性高,尽管这随着采样强度提高而改善。完全采样(采样强度=1)的结果预测最小阈值为0.909,相当于91%森林覆盖。任何模拟,无论采样策略如何,都未能 consistently 达到该值。对于具有最低采样强度(0.2)和随机采样策略的模拟,平均森林覆盖阈值为95%,范围在91%和100%之间。有趣的是,检测到蜘蛛猴的原始最低森林覆盖水平(79%)被两种采样策略在所有采样强度下检测到,除了0.2。
将实时检测知识纳入路径算法,在查看每次调查检测到的物种总数时,并未显示出比随机采样的改进。我们通过调整路径算法中的权重参数α研究了两种自适应路径策略:探索性(α=1)和利用性(α=5)。在非常低的采样强度(0.2)下,自适应利用策略平均检测到的物种丰富度高于自适应探索策略,但物种丰富度估计值并不高于随机采样策略。GLM结果显示,采样强度导致更高的物种丰富度(p<0.001),但测试的采样策略均无任何效果(探索性:p=0.58;利用性,p=0.85)。
我们发现采样策略对调查的采样均匀度(样本在一天中的小时和集群中站点间的分布均匀度)影响很小。我们发现随机、路径规划或自适应采样策略之间的采样均匀度没有差异。然而,路径规划模拟中50次模拟迭代间采样均匀度的变异大于随机或自适应模拟。虽然增加采样强度提高了平均采样均匀度得分,但最低采样均匀度值为0.95。这意味着即使对采样方案进行高度操作,对整体采样均匀度的影响也很小,并且在不增加下游分析复杂性的情况下,对直接比较跨站点采样数据的能力影响很小。
当查看无人机调查的总能耗时,使用路径规划采样策略减少了每架无人机的平均旅行时间和每架无人机的总充电站访问次数。这与随机和自适应采样策略中无人机行驶的距离形成鲜明对比。路径策略与其他策略在旅行时间和充电站访问次数上的差异在较高采样强度下更大,可能是由于创建了迫使无人机停留在某一地理区域的子组。
本研究表明,基于无人机的声学监测的间歇采样设计可以有效检测广泛的生物多样性模式,如与土地利用类型的关联,但在低采样强度下捕获完整物种列表的能力有限。这表明基于无人机的声学调查可用作识别高保护价值地点的快速、初步调查工具,减少手动部署声学传感器的需求。虽然先前关于无人机路径规划的研究主要集中在物流应用中优化效率,但本研究是第一个研究间歇采样策略对下游生物数据质量影响的研究。
调查设计的一个关键考虑因素是跨空间和时间的采样均匀度,以确保可以 straightforwardly 检测站点内和站点间的变异性。跨任一轴的不完整采样可能导致物种丰富度等生物多样性指标的偏差。我们假设旨在均匀分布站点访问的路径规划采样策略将提高采样均匀度。然而,我们发现采样策略对采样均匀度或下游生物多样性指标没有影响。这表明,只要采样强度足够高,即使是简单的、非优化的采样策略也能实现足够的站点覆盖。因此,我们的实验结果表明,基于无人机的调查提供代表性生物多样性度量的能力主要取决于部署的无人机数量或总调查周期长度,而不是这里测试的路径系统。
采用我们结果中某些采样强度的可行性取决于项目目标、预算和规模。对于100个站点的调查,强度0.4可能意味着同时部署40架无人机蜂群,或4架无人机依次访问10个站点的集群。我们的结果表明,较低的强度(0.2)可以检测广泛模式,如土地利用关联,但需要更高的强度(0.4–0.8)来准确检测特定信号,如物种栖息地阈值或完整物种列表。这些发现表明从业者可以根据其监测目标调整采样强度,进一步研究可以调查具有更多物种的研究如何改变这些解释。
自适应采样尚未广泛用于生物多样性调查,但自主机器人技术的进步为探索这种方法的潜力提供了新机会。这里采用的自适应采样并未显示出比随机采样的改进,可能是因为采样集群大多 within 单一土地利用类型,意味着自适应算法难以识别站点间的差异。这种策略在破碎化景观中可能表现更好,其中自适应采样可以揭示生物多样性梯度。此外,采用的自适应策略相对简单,依赖于一个变量:发声率历史。尽管发声活动先前已被用作声学指数,但没有生态理论将其与物种数量联系起来。发声率在我们的数据集中是一个有用的代理,因为许多站点根本没有检测,所以优先考虑“发声”站点增加了遇到物种的机会。更先进的自适应系统可以纳入实时非生物或生物因素,类似于无人机污染 mapping 中使用的方法。
无人机调查的实际部署可能受到其他因素影响,如对无人机的行为响应或天气条件,这些我们无法控制。先前关于无人机干扰的研究主要集中在最小化干扰的最佳飞行高度;然而,这里使用的间歇采样方法更受无人机降落后恢复时间的影响。无人机起飞或降落可能引发40米内鸟类的逃离反应,尽管其他研究发现鸟类发声率在雪地摩托噪声干扰后不到4分钟即可恢复。物种对无人机噪声的耐受性取决于焦点类群、无人机飞行路径和无人机模型的噪声水平。我们建议基于无人机的声学调查通过纳入降落后延迟期并在可能情况下使用更安静的无人机模型,并在监测前对其研究类群进行干扰初步测试,来考虑干扰效应。
鸟类检测数据集的一个限制是BirdNET仅检测了研究区域总鸟类物种的一个子集,限制了生态分析的可能性。BirdNET物种检测的准确性已被证明取决于公共存储库中可用发声的数量,训练数据从中提取。因此,在人类主导栖息地中频繁发声和常见遇到的物种往往以更高的准确性被检测,哥斯达黎加数据集就是这种情况。需要进一步的工作来理解当查看静态声学调查可能实现的更详细的物种栖息地使用指标时,降低的采样强度如何影响数据质量,例如占用率、群落组成或行为。
对于我们的模拟,我们基于商用无人机的电池容量,并未测试具有更长飞行能力或不同螺旋桨噪声的其他模型,因为我们的研究区域不受距离限制,且我们无法考虑干扰。实施本研究中提出的调查需要仔细整合新兴技术,例如集成传感器、太阳能对接站和高效数据共享系统。虽然单架无人机比静态声学传感器更昂贵,但总体成本可能更低,取决于采样强度、劳动力节省和延长调查持续时间。法律约束也影响可行性,因为许多国家要求无人机飞行保持视觉视线内(VLOS),尽管法规正在演变,英国民航局目标在2027年前允许超视距(BVLOS)操作。鉴于许多技术已经以原型形式存在,我们相信进一步投资于先进无人机蜂群设计的开发是合理的。
总之,我们的研究结果强调了基于无人机的声学监测作为生物多样性评估可扩展方法的可行性,并突出了使机器人辅助无人机调查成为现实的障碍。我们证明同时部署的无人机数量在决定检测成功率方面比采样策略的选择起着更大的作用,尽管路径规划将降低功耗。随着无人机技术的不断进步,需要进一步研究探索自主无人机生态调查在不同生态系统、分类群和数据收集方法中的应用。此外,未来的研究应优先开发在现场条件下验证的新型传感器放置方法和自主框架,以最大化其在保护科学中的潜力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号