基于仿真的空间显式近亲标记-重捕模型

《Molecular Ecology Resources》:Simulation-Based Spatially Explicit Close-Kin Mark–Recapture

【字体: 时间:2025年11月07日 来源:Molecular Ecology Resources 5.5

编辑推荐:

  野生种群数量估计是生态学和 conservation生物学的重要挑战。本文提出了一种新型方法CKMRnn,结合个体模拟与卷积神经网络,有效解决传统近亲标记重捕法在空间异质性和种群结构中的局限性。通过乌干达基巴莱国家公园非洲象数据验证,CKMRnn的95%置信区间较传统方法窄32%,同时保持与经典捕获重捕模型一致的数量估计。研究展示了深度学习在生态学种群调查中的创新应用价值。

  野生种群数量估计对于生态学家和保护生物学家而言是一项关键任务,然而,目前用于这一目的的工具往往需要大量人力和财力投入。近年来,基于遗传数据的新方法展现出巨大潜力,这些方法通常更经济且对生物的干扰更小。其中,一种被称为“近亲标记-再捕获”(Close-Kin Mark-Recapture, CKMR)的方法,通过识别样本中的近亲配对来估计种群数量,显示出良好的前景。然而,CKMR方法在应用过程中仍面临一些挑战,特别是在处理具有空间结构的种群和采样过程中存在的空间异质性时,缺乏相应的模型。本文提出了一种空间显式的CKMR方法——CKMRnn,该方法结合了基于个体的模拟与深度卷积神经网络(CNN)来估算种群规模。通过模拟测试,我们发现CKMRnn在处理空间异质性采样和空间种群结构时具有高度准确性,并且能够考虑种群历史等潜在干扰因素。为了验证该方法的实际效果,我们将其应用于乌干达基巴莱国家公园的非洲象种群数据,结果显示,CKMRnn的点估计与传统估算方法一致,但其置信区间比传统方法大约缩小了30%。

在保护生物学和野生动物管理中,种群数量是决定保护策略和管理措施的重要信息。然而,传统的估算方法,如直接观察或标记再捕获,往往成本高昂且难以实施。相比之下,基于遗传数据的方法提供了更便捷的途径。例如,通过非侵入性采集的毛发、粪便或狩猎样本,可以获取DNA信息,从而识别个体及其亲属关系。这种方法不仅可以用于难以直接捕捉的物种,还可以用于需要进行致死采样的系统,例如某些鱼类或海洋哺乳动物。然而,这些方法在处理具有空间结构的种群时仍存在局限,尤其是在采样强度在不同区域存在差异的情况下,传统方法可能会产生偏差。

CKMRnn方法通过引入空间信息来解决这一问题。该方法的核心思想是利用基于个体的模拟生成“图像”数据,这些图像包含了采样强度、近亲配对以及再捕获事件等关键信息。然后,通过训练一个卷积神经网络,将这些图像转化为种群数量的估计值。这种图像化的处理方式能够有效捕捉空间信息,同时避免了传统方法中难以建模的复杂空间动态。例如,在模拟中,我们通过网格划分的方式表示采样强度,并在每个网格单元中生成反映采样密度的热图。同时,通过线段连接个体的采样位置,以表示近亲配对或再捕获事件。这些图像作为输入,被卷积神经网络处理,从而实现对种群数量的估计。

为了验证CKMRnn方法的准确性,我们进行了多组模拟测试,包括不同采样强度和种群趋势的场景。在这些测试中,我们发现CKMRnn在所有采样偏倚水平下都能提供非常准确的种群数量估计,平均误差在1.5%以下。在采样强度均匀分布的情况下,CKMRnn的估计值与真实值非常接近,而在采样强度存在较大空间偏倚时,其置信区间仍保持较高的精度。此外,我们还测试了CKMRnn在种群趋势未知的情况下是否仍然能够保持稳健性。结果显示,当训练数据包括不同趋势的种群时,CKMRnn在所有趋势和采样偏倚条件下都能保持良好的性能,误差范围控制在10%以内。这表明CKMRnn不仅适用于已知趋势的种群,也能有效处理未知趋势的情况,从而提升了其在实际应用中的适应性。

在实际应用中,我们利用CKMRnn对基巴莱国家公园的非洲象种群进行了分析。该种群的采样数据来自Goodfellow等人(2025)的粪便样本,共收集了256个样本。通过分析这些样本的基因型数据,我们识别了124个独特的个体,并从中找到了260对亲子关系。我们生成了三组图像,分别表示采样强度、再捕获事件和亲子配对,并将其输入到训练好的神经网络中进行分析。最终,CKMRnn对非洲象种群数量的估计值为450只,其95%置信区间为323至620只。这一结果与传统的标记再捕获方法得出的估计值(454只,置信区间为316至752只)基本一致,但置信区间更窄,表明CKMRnn提供了更高的估计精度。

在分析过程中,我们还探讨了CKMRnn相较于传统方法的优势。传统方法在处理空间异质性采样时往往存在偏差,而CKMRnn通过图像化输入能够有效减少这种偏差。此外,CKMRnn利用卷积神经网络的结构,能够自动提取图像中的关键特征,从而提高了估计的准确性。在模拟测试中,CKMRnn在种群趋势未知的情况下仍然表现出良好的稳健性,这表明其在处理复杂种群动态时具有较强的适应能力。

CKMRnn方法的另一个优势在于其灵活性。由于其基于模拟的数据生成,可以轻松地适应不同的种群结构和采样方案。例如,对于某些种群,我们可以在模拟中调整参数,如个体移动距离、配偶选择范围等,从而更好地反映实际种群的动态。这种方法允许研究人员在没有精确的数学模型的情况下,通过调整模拟参数来探索不同的种群结构和采样模式。同时,CKMRnn的置信区间计算方式也更加精确,因为它通过参数化Bootstrap重复模拟来生成分布,从而更准确地估计不确定性。

尽管CKMRnn在模拟和实际数据中都表现出了良好的性能,但其仍然面临一些挑战。例如,如何处理年龄信息的不确定性,以及如何在模拟中更好地反映实际种群的空间异质性。目前,CKMRnn在模拟中假设种群年龄结构已知,但在实际应用中,年龄信息可能并不完全可靠。因此,未来的研究可以探索如何在模拟中引入年龄不确定性,并在神经网络中进行建模。此外,对于某些种群,如那些具有复杂空间分布的物种,可能需要进一步优化采样强度的表示方式,以确保模拟能够准确反映实际种群的空间特征。

CKMRnn方法的开发不仅提升了基于遗传数据的种群数量估计的准确性,还为未来的研究提供了新的工具。该方法的潜在应用范围广泛,不仅限于非洲象,还可以用于其他具有空间结构的物种,如森林象、红鹿、海豹等。通过结合空间信息和机器学习技术,CKMRnn能够更全面地反映种群动态,并为生态学家和保护生物学家提供更可靠的种群数量估计。此外,这种方法还可以用于估算其他种群参数,如种群密度和扩散率,为种群管理提供更丰富的信息。

总之,CKMRnn方法为解决空间结构种群数量估计的问题提供了一种新的思路。通过将空间信息与机器学习技术相结合,该方法能够更准确地处理复杂种群动态,并在实际应用中表现出良好的稳健性。虽然仍有一些挑战需要克服,但CKMRnn展示了在野生动物种群监测和保护研究中的巨大潜力。随着技术的进一步发展和模拟方法的优化,这种方法有望成为生态学和保护生物学中一种重要的工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号