利用可解释人工智能揭示海洋声景中的非线性生态动态
《Global Ecology and Conservation》:Unveiling Nonlinear Ecological Dynamics in Marine Soundscapes with Explainable AI
【字体:
大
中
小
】
时间:2025年11月21日
来源:Global Ecology and Conservation 3.4
编辑推荐:
海洋声音景观中生物与非生物因素的复杂非线性相互作用研究,采用XGBoost与SHAP分析,揭示不同频率范围(10-300Hz、300-3000Hz、3000-24000Hz及全频段)中环境因子与生物声学活动的动态关联,发现温度、潮汐、季节等驱动声压级变化的关键阈值,为生态监测提供可解释的机器学习方法。
在当前海洋生物多样性危机不断加剧的背景下,海洋声景监测正逐渐成为评估生态系统健康状况的一种有前景且成本效益高的方法。通过分析生物、非生物和人为因素之间的相互作用,这种方法能够揭示海洋生态系统的动态变化。然而,传统的声景分析往往依赖于单一的声学指标,这些指标通常无法准确捕捉复杂的时序互动和变化,尤其是在生物-非生物关系中。此外,随着自主监测技术的快速发展,声学数据集正以指数级增长,这进一步增加了分析的复杂性。因此,本研究提出了一种新的数据驱动框架,结合机器学习和可解释人工智能(XAI),以量化不同非生物和生物因素对多个频率带内海洋声景的影响。
在研究中,我们利用了XGBoost算法和SHAP(SHapley Additive exPlanations)分析,对2014年至2018年期间台湾海峡收集的长期声学数据进行分析。我们重点研究了四个不同的频率范围:10–300 Hz(主要由非生物因素主导)、300–3000 Hz(由鱼类合唱主导)、3000–24,000 Hz(主要由 snapping shrimp 活动主导)以及整个频率范围(10–24,000 Hz)。SHAP分析能够清晰识别每个频率带内的主要驱动因素,并量化多种非生物和生物因素的贡献程度。此外,SHAP依赖图还揭示了与季节、昼夜、年际、温度、鱼类合唱和 snapping shrimp 活动相关的具体时间趋势和模式。这种基于XAI的分析方法提供了更高的可解释性,为探索声景与环境之间的关系提供了有力工具,从而推动了海洋保护和生态系统管理的进展。
在海洋声景研究中,生物和非生物因素的相互作用是至关重要的。例如,许多海洋生物的发声行为会受到非生物因素的影响,如潮汐变化、月相、温度、季节性波动等。这些非生物因素不仅影响生物的发声行为,还直接或间接地塑造声景的组成。某些生物因素,如鱼类的群体鸣叫和 snapping shrimp 的活动,也表现出与这些非生物因素相关的时序模式。例如,冬季鱼类鸣叫的减少可能表明其迁徙或越冬策略,为理解生命循环和环境适应提供了线索。同时,降雨和潮汐运动是已知的非生物因素,它们通过添加宽带噪声或调节传播条件来影响声景。其他变量,如温度和月相,可能通过生理或生态途径间接影响生物发声行为。
尽管现有的声景分析方法在某种程度上能够揭示这些关系,但它们往往局限于单变量指标和线性相关性分析,这限制了对复杂生物-非生物相互作用的全面理解。因此,本研究提出了一种结合机器学习和XAI的新方法,以克服这些限制。XGBoost算法能够有效建模复杂的非线性关系,而SHAP则提供了对这些模型的解释性分析,使研究者能够明确识别和量化各因素对声景的贡献。这种结合不仅提高了模型的可解释性,还为生态学推理提供了更清晰的视角,使研究人员能够更准确地识别驱动声景变化的生态机制。
为了验证模型的有效性,我们对四个频率范围的声景数据进行了评估。使用了三种评价指标:决定系数(R2)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。在训练数据集中,XGBoost模型在300–3000 Hz频率范围内的表现最佳,该频率范围主要受鱼类合唱的影响。同样,对于完整的频率范围(10–24,000 Hz)和3000–24,000 Hz频率范围(主要由 snapping shrimp 活动主导),模型也表现出较高的预测精度。相比之下,10–300 Hz频率范围内的预测误差较高,因为该范围内的声景主要由非生物因素(如船舶交通、潮汐波动和风暴)主导,这些因素往往具有较大的不确定性。
SHAP分析进一步揭示了不同频率范围内的因素影响。在完整的频率范围内,300–3000 Hz和3000–24,000 Hz的声压水平(SPL)对预测结果贡献最大,分别由鱼类合唱和 snapping shrimp 活动主导。此外,夏季和温度变化也被证明是重要的影响因素,它们在不同频率范围内对声景的贡献有所不同。例如,在300–3000 Hz范围内,夏季的SPL显著增加,这与鱼类活动的增强有关;而在3000–24,000 Hz范围内,温度的升高则与 snapping shrimp 的活跃度增加相关。这些发现强调了生物和非生物因素在不同频率带内的相互作用,以及这些相互作用如何影响海洋声景的结构和动态。
本研究的另一个重要发现是,不同频率范围内的声景具有独特的生态功能和响应机制。例如,低频范围(10–300 Hz)主要由非生物因素主导,其变化与天气和地形密切相关;而中高频范围(300–3000 Hz和3000–24,000 Hz)则主要反映生物活动,如鱼类的群体鸣叫和 snapping shrimp 的活动。这些频率范围内的声景变化不仅受到环境条件的影响,还受到生物行为的调控。通过频率范围的划分,我们能够更细致地分析声景的组成,识别不同生态组件对特定频率带的影响,并揭示生态系统的复杂结构。
此外,SHAP分析还揭示了不同因素之间的非线性关系。例如,在夏季,声景的变化表现出明显的峰值,这与鱼类和 snapping shrimp 的活跃度增加有关。而在冬季,声景的变化则主要由非生物因素(如风暴和冷锋)驱动。这些发现不仅加深了我们对海洋声景动态的理解,还为预测生态系统对环境变化的响应提供了重要的依据。例如,通过分析不同频率范围内的声景变化模式,我们可以识别出哪些因素在特定季节或时间段内具有更高的影响,从而为制定有效的保护措施提供科学支持。
研究还强调了频率范围划分在声景生态学中的重要性。频率范围的划分使得研究人员能够更清晰地识别不同生态组件和过程的贡献,从而揭示海洋生态系统中复杂的相互作用。例如,在完整的频率范围内,声景的变化主要由中高频带内的生物活动驱动,而在低频范围内,非生物因素的影响更为显著。这种频率范围的区分不仅有助于理解声景的组成,还为不同生态系统中声景的比较提供了基础。例如,昆虫主导的高频率声景对温度变化较为敏感,而低频率声景(如海浪和风声)则更多地受到天气和地形的影响。
本研究的成果表明,基于XAI的分析方法能够提供更深入的生态洞察,帮助研究人员识别和量化不同因素对声景的贡献。这不仅有助于理解海洋生态系统的动态变化,还为海洋保护和生态系统管理提供了新的工具。例如,通过频率范围的划分,我们可以识别出特定时间段内声景的变化模式,从而为监测和评估生态系统的健康状况提供依据。此外,SHAP分析还揭示了某些生态阈值,这些阈值可以作为早期预警信号,用于监测生态系统的变化并采取及时的干预措施。
尽管本研究取得了一定的进展,但仍存在一些局限性。例如,SHAP方法主要揭示了因素之间的相关性,而非因果关系,这可能导致对生态机制的误解。此外,模型的有效性高度依赖于数据质量,因此需要确保长期的声景监测数据集具有较高的准确性和代表性。未来的研究可以进一步探索如何将SHAP分析与实时监测系统结合,以提高模型的动态响应能力。同时,也可以考虑将声景分析扩展到更广泛的地理区域和不同的生态系统,以验证其普适性和有效性。此外,通过优化特征选择方法和减少计算复杂性,可以提高这些方法的可扩展性和实用性。
总的来说,本研究通过结合XAI和机器学习方法,为海洋声景分析提供了一种新的视角。这种方法不仅能够揭示复杂的生态相互作用,还能够为海洋保护和生态系统管理提供科学依据。通过频率范围的划分和SHAP分析,我们能够更清晰地理解不同因素对声景的影响,从而为制定有效的保护策略和政策提供支持。未来,随着技术的进一步发展和数据的持续积累,基于XAI的声景分析方法有望在更广泛的生态学研究中发挥重要作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号