通过扩展目标区域提升保护物种潜在分布预测精度与优先保护区保护成效

【字体: 时间:2025年09月24日 来源:Diversity and Distributions 4.2

编辑推荐:

  本综述提出了一种创新方法,通过将研究区域扩展至生物地理区域(如喜马拉雅地区),并补充扩展区域的物种出现数据,有效改善了物种分布模型(SDM)预测潜在物种分布(SPD)的准确性。研究利用MaxEnt和Zonation工具,在不同情景下评估了保护优先区(PCAs)的保护成效与生态代表性,为解决数据缺失区域的生物多样性保护规划提供了可操作且可推广的框架。

  

引言

自人类世以来,生物圈完整性已超出地球边界,导致生物多样性丧失,成为全球最紧迫的挑战之一。采取有效的保护行动应对这一危机已成为全球广泛关注的议题。基于保护对象生物地理分布识别优先保护区(PCAs)是保护生物多样性的有效途径。通常,PCAs通过精细过滤器(如受威胁物种)或粗过滤器(如自然植被或关键栖息地类型)进行识别。然而,证据表明,栖息地类型过于宽泛,不足以代表生物多样性特征,而使用物种作为替代指标被广泛认为是一种更有效的方法,尤其是维管植物,可作为其他物种群和非生物环境的关键替代代表。

尽管如此,大量物种仍未描述(即林奈短fall),且对其地理分布了解有限(即华莱士短fall)。生物资源仍面临清单不清的挑战,这阻碍了提高生物多样性保护规划和管理的有效性。当前,尽管全球生物多样性大数据平台(如全球植物区系和性状清单、全球生物多样性信息设施和iDigBio)取得了显著进展,提供了全球物种的全面空间数据,但物种数据往往存在位置不准确和遗漏错误、信息传播碎片化以及资源整合不足等问题,导致数据不完整和质量低下,成为提高生物多样性保护有效性的障碍。

为克服生物多样性数据的缺陷,物种分布模型(SDMs)被用于预测未采样区域的物种潜在分布(SPDs)。制定SDMs的基本要求是收集准确的物种数据和获取完整的预测变量。然而,由于生物多样性保护由行政部门实施,许多SDM研究通常过度依赖政治边界定义的区域数据集。这种方法经常引入局限性,无法全面描述物种的环境耐受性。具体而言,使用截断的出现数据集和截断的气候空间通常导致物种分布预测中的空间生态位截断效应。因此,近期研究提出了一种数据驱动的解决方案,将研究区域外的物种出现数据外推,以尽可能覆盖该物种的完整生态位。这种方法减轻了因物种数据缺陷导致的错误,并为未充分采样区域的潜在生态位预测提供了新视角。

物种分布范围数据用于空间优化算法,在系统保护规划框架内识别具有成本效益的PCAs。因此,物种出现数据的完整性是影响保护规划准确性和有效性的关键因素,但保护有效性仍存在争议。研究表明,受威胁物种出现数据的缺陷会影响保护资源的分配,导致不同空间尺度保护有效性的巨大差异,需要详细和整合的物种出现数据来制定保护计划。然而,其他研究表明,即使在保护规划中考虑了整合的生物多样性数据,鉴于生物多样性的持续下降,受威胁物种的保护有效性并未显著增加。传统上,大多数保护规划基于物种的截断生物气候生态位空间,但这种截断数据集对保护规划的影响尚不清楚。因此,研究不同空间尺度上物种出现数据完整性对保护规划有效性的影响至关重要。

根据全球生物多样性保护框架,到2030年,通过参与性、整合性和生物多样性包容的空间规划和/或有效管理努力,确保具有高度生态完整性的最重要生物多样性损失减少到接近零至关重要。高生物多样性重要性区域识别的准确性与物种数据完整性密切相关,显著影响保护规划和恢复努力的有效性。此外,SPD预测最近被列为一些国家建设项目生物多样性影响评估的新组成部分。然而,对于占用较小区域的项目,获取足够的出现数据仍然具有挑战性,影响了评估准确性。为满足生物多样性保护的“30×30”目标并满足生物多样性影响评估的实际需求,用扩展区域获得的物种出现数据补充截断空间(即研究区域)中的物种出现数据可以增加其互补性。这种方法为应对生物多样性保护和实际需求提供了新视角。

方法

本研究以东南喜马拉雅生物多样性优先保护区为目标区域,并将其扩展至喜马拉雅生物地理区域,该区域基于物种分布相似性聚类定义,目标区域外的区域作为扩展区域。结合目标区域和扩展区域的可用物种数据,根据受威胁、特有和国家重点保护植物物种的出现数据可用性,设置了三种情景。使用MaxEnt预测物种的潜在分布(SPDs),并使用Zonation识别三种情景下的优先保护区(PCAs),评估了SPD预测准确性、保护有效性和生态代表性。

目标区域是东南喜马拉雅生物多样性优先保护区,覆盖西藏自治区四个地级市的21个县。该地区地形复杂,海拔变化大,印度和欧亚构造板块碰撞导致喜马拉雅隆起,形成明显的高山峡谷。气候复杂,垂直梯度从寒带到热带或亚热带气候带,形成多样植被类型,其中阔叶林最为普遍。植物物种主要包括印度-马来西亚、中国-喜马拉雅和北温带成分,整个地区共有约3300种种子植物。然而,较高海拔迫使物种发展内部适应机制并面临外部压力,导致许多野生植物物种减少或濒危。

扩展区域选择了喜马拉雅生物地理区域,该区域与目标区域位于同一地区,基于物种分布相似性聚类结果定义。喜马拉雅生物地理区域包括两个亚区:喜马拉雅南翼山地热带和亚热带森林(BR-I)和藏南山地灌丛草原(BR-II),共涵盖六个生物地理单元。

物种出现数据整合了多个来源,包括全球生物多样性信息设施(GBIF)和国家标本信息基础设施,并进行了野外调查。选择具有明确空间信息的物种出现数据,并使用生命目录验证物种学名,合并同物异名。将列为受威胁(根据IUCN红色名录标准为极危、濒危和易危)、特有或国家重点保护的物种分类为保护物种。这些物种根据IUCN受威胁物种红色名录、中国国家重点保护野生植物名录、中国生物多样性红色名录—高等植物、中国高等植物受威胁物种名录和墨脱植物等权威来源选择。最后,使用SDMtoolbox 2.4在1公里规划单元内空间过滤物种出现数据,确保每个规划单元每个物种只保留一个出现记录。

为增加目标区域内明确物种信息的全面性,从扩展区域选择相同物种补充其出现数据,并添加扩展区域存在但目标区域缺失的保护物种出现数据。在此基础上,设置了三种情景。情景1仅使用目标区域的明确物种出现数据预测SPDs和识别PCAs。情景2使用扩展区域的出现数据补充目标区域的明确物种出现数据,增加验证SPD预测准确性的样本量。情景3考虑野外调查可能遗漏,选择扩展区域存在但目标区域缺失的保护物种出现数据,补充情景2得出的目标区域物种出现数据。通过情景分析,发现情景1、2和3分别包括895、895和1383个保护物种。在情景1中,275个物种出现次数≥5,而在情景2和3中,出现次数≥5的物种数量分别增加到375和412。

为减轻物种出现数据缺陷的限制,使用MaxEnt 3.4.1预测SPDs。MaxEnt是一种基于最大熵原理的机器学习程序,通过考虑环境约束预测物种的概率分布。该程序识别最分散或近乎均匀的概率分布,满足反映物种出现和环境因素不完全信息的一系列约束。在SDM算法中,MaxEnt以仅使用出现数据而闻名,并与替代预测算法相比表现出卓越性能,尤其在物种出现数据有限时表现显著。重要的是,当物种出现数据和运行重复次数足够时,MaxEnt和集合模型都可以提供相当准确的预测。

环境变量在决定预测准确性方面起着关键作用,因此仔细选择了气候、土壤和地形因素作为MaxEnt的主要输入,因为它们极大地影响植物生长和分布。具体而言,气候组件包括19个变量,如温度和降水,源自WorldClim 2.1,分辨率为30秒。土壤数据,包括0-15厘米深度的粘土和沙含量,从SoilGrids获取,分辨率为250米。地形因素包括海拔、坡度和坡向。最初,数字高程模型(DEM)数据分辨率为30秒,从WorldClim 2.1获取,从中导出坡度和坡向。所有环境变量随后标准化为1公里的统一分辨率,并统一坐标系和边界。为解决高变量相关性导致预测过拟合的潜在问题,对三种情景下的24个环境变量进行Pearson相关分析,仅保留相关系数|r| < 0.8的变量。然后,从剩余变量中提取生态代表性环境变量。最终,为情景1获得10个环境变量,为情景2和3各获得12个环境变量作为MaxEnt的输入。

接下来,将环境变量和出现次数至少为5次(即可预测物种)的保护物种数据从三种情景导入MaxEnt。使用物种数据集,75%的物种出现用于模型训练,其余25%用于模型测试。在此过程中,配置模型参数为10次重复和10,000个背景点,并根据物种出现次数选择特征类型,对应线性(5≤出现次数<10)、二次(10≤出现次数<15)和铰链(出现次数≥15)类型。模型执行后,使用受试者工作特征曲线下面积(AUC)评估模型预测性能。仅AUCtest ≥ 0.7的物种被视为成功预测,其潜在分布图用于进一步分析。对于这些成功预测的物种,MaxEnt生成的连续概率值使用最大训练灵敏度加特异性阈值(出现次数在5到9之间)和10百分位训练存在阈值(出现次数至少为10)转换为二进制值。最后,将情景2和3中成功预测的物种潜在分布图在喜马拉雅生物地理区域内裁剪至目标区域。随后叠加各种物种的潜在分布,确定目标区域内的物种丰富度。物种丰富度使用自然断点法分为I-V级,表示物种丰富度逐渐增加,IV-V级代表高丰富度区域。

采用Jaccard相似系数(Jsc)计算三种情景下物种丰富度的分布相似性,以及地级市级别和自然断点法分类的五个丰富度级别的物种组成相似性。

在物种数据有限的区域,基于互补性的方法对于识别PCAs非常有效。与其他定量空间优先排序方法不同,Zonation基于互补性和整个景观的平衡生成保护优先级排名,而不仅仅是满足最低成本目标。因此,使用Zonation v4.0识别目标区域内的PCAs。在Zonation过程的每次迭代中,基于输入数据评估所有单元的保护值,导致识别和移除最不重要的单元。每个单元的保护优先级排名由该移除顺序建立,最高优先级给予最后被移除的单元。

提取物种出现不可预测(<5次出现)或预测不成功(AUCtest < 0.7)的1公里网格单元代表其空间分布。这些网格与MaxEnt成功预测的物种分布图整合到Zonation进行分析。对于情景2和3,在运行Zonation之前将SPDs裁剪至目标区域。随后定义Zonation中的参数。首先,采用加性效益函数作为核心算法规则,通过选择网格单元内所有保护对象总和值最低的网格,最小化边际损失,从而强调整体物种丰富度。其次,使用边缘移除通过从剩余景观边缘移除网格单元来增强景观连接性。第三,设置扭曲因子值为1,允许程序一次只移除一个单元格。此外,成本地图层使用Kennedy等人提供的数据指示人类干扰。最后,根据受威胁类别、特有性和国家保护级别,为物种分配相应权重,遵循《自然保护区生物多样性保护价值评估技术规范》指南。然后整合不同类别的物种权重生成加权分数。最后,基于2020年GlobeLand30数据,排除分类为农田和人工表面的区域,并根据昆明-蒙特雷全球生物多样性框架的目标2,将Zonation产生的保护值按降序排序,选择目标区域前30%作为生物多样性PCAs。

为评估使用目标区域物种出现数据并结合扩展区域数据识别目标区域内PCAs的保护性能,进行了两项分析:(1)通过计算每种情景下PCAs对SPD区域的覆盖来评估保护有效性;(2)通过计算识别出的PCAs对优先生态系统(包括优先森林、湿地和草原生态系统)的覆盖来评估其生态代表性。

结果

情景1中物种出现的空间分布明显不均匀,大多数出现集中在BU-Id南部以及BU-Ia和BU-Ic交界地区。重要的是,388个物种分布在墨脱县,占目标区域总物种的43.35%,大量保护物种也出现在BU-IIb的亚东、吉隆和聂拉木县的山谷地区。在情景2和3中,物种出现主要聚集在BU-Id周围,分别占各情景总物种数的78.55%和52.78%。相反,最少的物种出现在BU-Ia和BU-IIa,约占各情景总物种的11.28%-17.65%。

在情景1中,高物种丰富度(IV级和V级)区域集中在BU-Ia、BU-Ic、BU-Id南部以及BU-IIb中部和东部。相比之下,情景2和3随着物种数量及其出现的增加,物种丰富度从西向东逐渐增加。两种情景在BU-IIa和BU-IIb表现出较低的物种丰富度和更分散的分布,而在BU-Ib北部观察到较高的物种丰富度,特别是在隆子、墨脱中部和错那中部县,物种数量显著增加。

情景1、2和3目标区域内物种的平均潜在分布范围分别为26,176.75、31,191.00和32,413.83平方公里,这些范围之间存在显著差异。情景2和3产生的潜在分布范围比情景1大得多,情景3的分布明显更大。在丰富度I级,三种情景之间的分布相似性最高,Jsc值超过0.90。随着物种丰富度从II级增加到V级,分布相似性也逐渐增加。在II-IV级,Jsc值在0.22到0.30之间变化,表现出较低的空间重叠度。在V级,情景1和2以及情景1和3表现出中等相似性(Jsc = 0.52-0.53)。值得注意的是,情景2和3在I-V级表现出Jsc值 above 0.82,表明物种丰富度空间分布的一致性很高。

跨行政单元和丰富度级别的物种数量越多,情景之间的物种共性越大,表明物种组成越相似。对四个地级市的物种组成相似性分析显示,林芝的相似性最高,范围0.93-0.96,其次是山南(0.83-0.88)、日喀则(0.75-0.81)和昌都(0.63-0.68)。比较而言,情景1和2之间的物种组成相似性略高于情景1和3。此外,随着丰富度级别的增加,情景之间的物种组成相似性增加。在I级区域,情景1和2以及情景1和3之间的相似性小于0.33,表明物种组成存在显著差异。相反,V级区域显示出最高的相似性,为0.83,而II、III和IV级区域指示值范围0.57-0.68,反映中等水平的物种组成相似性。特别是,情景2和3之间的物种组成相似性超过0.85,表明高度相似。

在情景1中,共有275个物种使用MaxEnt成功预测,77.82%的物种出现次数在5到10次之间。平均AUCtraining和AUCtest分别达到0.89和0.79,表明即使对于大多数只有5-9次出现记录的物种,预测准确性也很高。随着可预测物种和出现次数的增加,模型预测准确性相应提高。与情景1相比,情景2中可预测物种数量增加到375。在情景3中,作为情景2的扩展,另外35个物种可以被预测。情景2和3的平均AUCtraining和AUCtest值增加到0.92和0.84,分别达到优秀的预测准确性水平。

在情景1中,具有最高保护值的30% PCAs主要分布在BU-Ia、BU-Ic、BU-Id南部、BU-IIa南部和BU-IIb。相比之下,情景2和3表现出东部高西部低的整体保护值模式,其各自的30% PCAs集中在藏东南和BU-IIb内的亚东、吉隆和聂拉木县的山谷地区。这三种情景的PCAs表现出显著的空间一致性,特别是在BU-Ia北部、BU-Ic和BU-Id南部。空间分布相似性分析显示情景1和2之间高度相似(Jsc = 0.72),情景1和3之间也高度相似(Jsc = 0.71),而情景2和3之间极其相似(Jsc = 0.97)。

基于30% PCAs对每种情景SPD区域的覆盖,情景1的PCAs(83.75%)比情景2(78.67%)和情景3(77.91%)覆盖了更多的SPD区域,但仍有七个物种在所有三种情景中未被PCAs覆盖。此外,每种情景的PCAs覆盖了其他两种情景的SPD区域。情景1的PCAs对情景2和3的SPD区域覆盖最低(76.83%和75.72%)。情景3对情景1和2的SPD区域平均覆盖最高(78.71%-82.20%),而情景2对情景1和3的SPD区域覆盖排名第二(77.74%-82.19%)。此外,情景2和3的PCAs大多覆盖其他两种情景SPD区域的49%到100%,而情景1的覆盖大多在42%到100%之间。值得注意的是,情景2和3中的12个物种未被情景1的PCAs覆盖。

优先森林、草原和湿地生态系统出现在目标区域。其中,优先草原生态系统覆盖面积最大(18.20%),连续分布在BU-IIa南部和BU-IIb。优先森林生态系统集中在BU-Ib南部和BU-Ic,占面积的6.02%。优先湿地生态系统覆盖最低(1.11%),稀疏分布在BU-IIa南部和BU-IIb。三种情景下优先生态系统与PCAs的空间重叠相对较低(10.20%-31.55%),草原生态系统的覆盖(28.13%-31.55%)高于湿地(10.20%-12.84%)和森林生态系统(11.36%-12.21%)。具体而言,情景1对草原生态系统的覆盖最高(31.55%),而情景2和3对优先森林和湿地生态系统的覆盖略高于情景1。

讨论

在大数据时代,全球生物多样性数据库的开发取得了显著进展。然而,地球上的确切物种数量仍不确定,物种出现的分类、地理和时间信息在清单不完整性、不确定性和偏差方面仍存在知识差距。这些差距经常引发相互关联的问题。例如,林奈短fall不可避免地影响华莱士短fall,随后影响物种潜在生态位的预测,通常称为哈钦森短fall。当前,已探索了对不完整物种数据集的生态位预测,模型结果的准确性直接影响保护规划决策。

SDM研究的一个关键挑战是确定研究区域的最佳空间范围以捕捉物种的完整生态位。然而,许多研究通常依赖受行政边界限制的截断出现数据集和气候空间,导致物种分布预测中的空间生态位截断。先前的研究建议将采样扩展到国家或全球尺度以更好地捕捉完全实现的生态位,但实际实施仍然具有挑战性。值得注意的是,物种分布主要由环境因素驱动而非行政单元。我们的研究超越了行政边界限制,将研究区域扩展到具有相似物种分布和环境条件的生物地理区域。选择与目标区域位于同一地区的喜马拉雅生物地理区域作为扩展区域。结果表明,扩展区域(情景2和3)补充了目标区域的物种及其出现,显著增加了出现次数≥10的物种比例。在调查区域,如墨脱和错那,物种数量分别从297增加到499和416增加到610,更准确地代表了物种分布模式。

生态建模中经常发生生态位截断,但关于通过扩展研究区域增加物种和样本量对模型预测准确性影响的研究仍然有限。这里,通过使用扩展区域和目标区域的物种和出现(情景2和3),我们观察到目标区域内物种丰富度和SPD范围显著增加。重要的是,MaxEnt的预测准确性(AUCtraining = 0.92和AUCtest = 0.84)更高,结果比情景1更接近实际分布。这种改进可归因于环境异质性的相应增加,补偿了采样遗漏错误。这在情景2和3的高丰富度区域尤其明显,特别是在墨脱、波密、错那、察隅和亚东县。这些发现与西藏自治区受威胁和特有物种的空间分布非常吻合,并与先前的研究结果一致。特别是,我们将我们的发现与Liu等人报道的青藏高原物种丰富度进行了比较,发现情景2的物种丰富度分布高度相关且高度一致。情景3的模型预测准确性略低于情景2,这可能归因于情景3中出现次数≥10的物种比例(45.15%)低于情景2(47.47%)。尽管物种样本量略微影响预测准确性,但它是真实准确性的最关键预测因子之一。

关于物种组成和分布相似性,情景1和2包含相同的物种,而情景3包括额外的保护物种,导致情景1和2之间的组成相似性高于与情景3。值得注意的是,尽管存在这些组成差异,情景3与情景1的分布相似性高于与情景2,这可归因于情景3中新物种与情景1中物种的栖息地重叠。在所有情景中,随着物种丰富度级别和行政单元中物种数量的增加,物种组成和分布的相似性也增加。特别是,与其他级别相比,I级物种丰富度的分布相似性最高可能归因于藏西南以及冰川和湿地地区物种数量较少或缺失。总体而言,我们的结果表明,通过扩展目标区域补充物种出现减少了由于遗漏错误和由于采样不足或边缘分布物种导致的生态位截断而错误排除保护物种的风险。此外,情景2和3产生更广泛的分布范围并改善生态位完整性,从而加强生态系统完整性以促进韧性、抵抗力和管理有效性。

生物多样性保护规划的有效性和全面性容易受到有缺陷的生物多样性数据和采样偏差的影响。通常,从不完整数据集中识别的PCAs优先考虑物种调查详细的区域,但可能会错过具有有限物种出现的重要区域,导致不稳定的空间解决方案。先前的研究主要调查研究区域内不完整物种数据集对保护规划有效性的敏感性,经常忽视研究区域外物种的影响。为克服华莱士短fall,我们提取目标区域和扩展区域的物种出现数据,使用互补算法识别PCAs。我们的结果表明,在情景1中,基于较少物种出现识别的PCAs分布在

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号