仅存在性渔业兼捕数据导致BC大陆架与斜坡软珊瑚物种分布预测产生偏差:对海洋保护区的启示
【字体:
大
中
小
】
时间:2025年10月08日
来源:Canadian Journal of Fisheries and Aquatic Sciences 2.2
编辑推荐:
本刊推荐:针对仅存在性渔业兼捕数据在物种分布模型(SDMs)中产生的偏差问题,研究人员以BC省大陆架与斜坡的Alcyonacea珊瑚为研究对象,对比分析了广义加性模型(GAM)与最大熵模型(Maxent)在不同数据类型下的预测性能。研究发现使用分层随机调查(StRS)获得的存在-缺失数据能产生无偏估计,而仅存在性兼捕数据会导致分布预测偏差和过于乐观的模型评估指标(AUC和TSS)。该研究强调了采用科学调查设计获取存在-缺失数据对于海洋保护区(MPAs)优化布局、减少不必要经济损失的重要意义。
在深邃的海洋深处,栖息着一类神秘而重要的生物——软珊瑚(Alcyonacea)。这些 sedentary benthic species(定居性底栖物种)如同海底的森林,为众多鱼类和无脊椎动物提供 critical habitat(关键栖息地)。然而,这些珊瑚生长缓慢、寿命极长,种群分布 patchy(零散),且容易受到底拖网捕捞等 anthropogenic activities(人类活动)的威胁。评估这些敏感物种面临的 risks(风险),并据此科学规划 marine protected areas (MPAs)(海洋保护区)和渔业禁捕区,离不开一个关键工具:species distribution models (SDMs)(物种分布模型)。
理想的SDMs需要 unbiased(无偏的)数据支撑,但获取高质量数据在深水环境中面临巨大挑战。目前,科研和管理实践中常常使用一种便捷但可能存在问题的数据:presence-only bycatch data(仅存在性兼捕数据)。这些数据来自商业渔业活动中偶然捕获的非目标物种记录,覆盖范围广、获取成本低,但存在一个致命缺陷——它们是在渔民追逐目标鱼群的过程中产生的,采样 effort(努力量)集中在渔获高的区域,而非珊瑚真正可能栖息的地方。这导致数据存在严重的 sampling biases(采样偏差)。使用这类数据构建的模型,预测的究竟是物种的 habitat associations(栖息地关联),还是仅仅是数据收集方式的模式呢?与此同时,通过 autonomous camera systems(自主相机系统)等设备,按照 stratified-random survey (StRS) design(分层随机调查设计)收集的 presence–absence data(存在-缺失数据)虽然统计上更为稳健,但获取成本高昂且操作复杂。
这两种数据类型孰优孰劣?不同的建模方法(如常用的 Generalized additive models (GAMs)(广义加性模型)和 Maximum entropy models (Maxent)(最大熵模型))又会如何影响预测结果?这些问题的答案直接关系到MPA布局的科学性和有效性。不准确的SDMs可能导致保护区的误置,要么将渔业努力量转移到其他未被识别的敏感栖息地,要么不必要地限制了对敏感物种并不 prevalent(盛行)的宝贵渔场的进入,造成巨大的 economic losses(经济损失)。
为了回答这些紧迫的问题,由Olivia M. Gemmell领衔的研究团队在《Canadian Journal of Fisheries and Aquatic Sciences》上发表了一项深入研究。他们以加拿大不列颠哥伦比亚省(BC)大陆架和斜坡的软珊瑚(Order Alcyonacea)为案例,巧妙地结合了真实数据分析和模拟实验,系统性地揭示了数据类型和模型选择对物种分布预测准确性和偏差的影响。
本研究主要采用了以下几种关键技术方法:1) 数据收集与处理:利用StRS调查设计(通过自主相机系统)获取了209个存在-缺失观测点(17个存在点,192个缺失点),同时从渔业管理部门获取了1995-2020年间的商业渔业仅存在性兼捕数据(593个存在记录,空间分辨率为2 km)。2) 环境变量制备:收集并处理了包括深度、地形指数(BPI)、粗糙度、坡度、叶绿素a浓度、海流速度、潮汐流速、温度、盐度、底质类型和历史捕捞努力量等16个环境预测变量,最终筛选出10个低共线性变量用于建模。3) 物种分布模型构建:分别使用GAM(针对存在-缺失数据)和Maxent(针对仅存在性数据)构建了软珊瑚的分布模型,并进行了模型选择与优化。4) 模型性能评估:采用空间块交叉验证,使用AUC(Area Under the Curve)、MSPE(Mean Squared Prediction Error)、TSS(True Skill Statistic)和SEDI(Symmetric Extremal Dependence Index)等指标评估模型性能。5) 模拟分析:开发了一个模拟算法,以GAM预测的“真实”概率分布为基准,生成了100个测试数据集,用于评估四种模拟场景(GAM_PA, GAM_PO, Maxent_PA, Maxent_PO)的偏差方向和幅度。
3.1. GAM和Maxent对预测变量重要性的估计
基于存在-缺失数据的GAM中,最重要的预测变量是深度(37%)、潮汐流速(27%)、水深位置指数(BPI)(22%)和坡度(16%)。条件效应表明,软珊瑚存在的概率随着所有这些预测变量的增加而持续增加。
相比之下,基于仅存在性数据的Maxent模型中,贡献最大的预测变量是深度(79.6%)、坡度(5.4%)、岩石底质(3.7%)和叶绿素a浓度(2.4%)。其条件效应显示出复杂的关系:存在概率随深度和岩石底质增加而不断减少,随坡度(峰值在10%至40%之间)和叶绿素a浓度(峰值在1至2.5 mg/m3之间)呈 dome shaped(穹顶形)变化。
最佳拟合GAM的平均AUC为0.77(可接受的区分度),MSPE为0.07,TSS为0.31,SEDI为0.44。
最佳拟合Maxent模型的平均AUC为0.81(优秀的区分度),MSPE为0.13,TSS为0.52,SEDI为0.69。仅从交叉验证的评估指标看,Maxent模型表现更优。
最佳拟合GAM和最佳拟合Maxent模型预测出的珊瑚在整个研究区的分布存在显著差异。GAM预测在大陆斜坡的更深区域有更高的存在概率,且在研究区北部最为集中。而Maxent模型预测在更深的大陆斜坡区域存在概率较低,且在整个研究区内分布较为均匀。更重要的是,Maxent模型在兼捕观测数量多的区域预测出更高的珊瑚存在概率,而在兼捕观测少或无的区域预测出更低的概率,这表明模型可能更多地是在预测采样 effort 的分布,而非珊瑚本身的栖息地偏好。
最佳拟合GAM和最佳拟合Maxent模型的预测结果呈中度负相关(rho = -0.56, p < 0.001),即一个模型预测概率高的地方,另一个模型则预测概率低,反之亦然。这种差异在 proposed bottom longline closures(拟议的底延绳钓禁捕区)的评估中尤为明显。例如,在Offshore NW Dixon Site(西北迪克逊海外站点),Maxent模型预测的平均存在概率为0.477,而GAM预测的概率仅为0.015,相差超过30倍。
模拟分析揭示了更为深刻的洞察。当使用StRS样本设计(GAM_PA)时,模拟模型的平均AUC为0.76,其分布与最佳拟合GAM的交叉验证AUC值重叠,表明评估是合理的。然而,当使用兼捕样本设计(Maxent_PO)时,模拟模型的平均AUC仅为0.65,其分布与最佳拟合Maxent模型的交叉验证AUC值(0.81)完全分离,这表明基于仅存在性兼捕数据和交叉验证的Maxent模型评估产生了过于 optimistic(乐观的)和有偏的AUC估计。
此外,模拟的仅存在性Maxent模型(Maxent_PO)平均高估了存在概率,特别是在模拟存在点周围,并且未能识别出软珊瑚特有的 patchy coral populations(斑块状珊瑚种群)分布。更令人惊讶的是,即使使用存在-缺失数据,模拟的Maxent模型(Maxent_PA)也产生了类似GAM的AUC值,但仍然表现出高估整体存在概率和忽略斑块分布的趋势,这表明AUC可能不是评估Maxent模型预测偏差的可靠指标。
本研究通过严谨的对比和模拟分析,证实了一个关键结论:使用存在-缺失数据并遵循稳健调查设计(如StRS)的GAM,能够提供相对无偏且更接近真实的物种分布预测。而使用仅存在性渔业兼捕数据,无论搭配GAM还是Maxent模型,都会导致有偏的物种分布预测。尤其值得注意的是,基于兼捕数据的Maxent模型通过交叉验证得出的性能评估指标(如AUC)是 inflated( inflated)和有误导性的,它们并不能真实反映模型对未知数据的预测能力。
这一发现对全球范围内的海洋保护,特别是加拿大的海洋保护目标(到2030年保护30%的海域)具有重大的现实意义。许多现有的珊瑚分布数据源自商业渔业兼捕样本,并常用Maxent等模型进行预测以指导MPA的布局。本研究表明,依赖这些有偏的数据和模型可能会导致保护区的 misplacement(误置)。例如,根据有偏预测设立的保护区(如本研究中的Dixon EntranceSite)可能并未覆盖真正的核心珊瑚栖息地,反而可能将捕捞努力量转移至未被保护但更具生态价值的区域,或者造成不必要的经济损失。
研究的深远意义在于它强调了投资于科学设计的调查以收集存在-缺失数据的必要性。虽然成本较高,但这类数据能提供无偏的、可推广的推断,避免模型预测采样偏差而非生态关系。对于珊瑚这类 sedentary and long-lived(定居且长寿)的物种,一次性的精心设计的调查其成果可以长期有效。未来的研究可以基于本研究确定的栖息地关系,设计统计功效更高的 presence–absence survey(存在-缺失调查),从而为海洋空间管理和保护决策提供更坚实的数据基础。
总之,Gemmell等人的研究为物种分布建模领域敲响了警钟。它清晰地表明,在追求便捷和覆盖范围的同时,不能牺牲数据的统计稳健性。为了有效保护珍贵的深海珊瑚生态系统,优化海洋保护区的布局,并最小化对渔业的经济影响,采用基于科学调查获取的存在-缺失数据来构建物种分布模型,应成为未来的黄金标准。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号