基于条件扩散模型的动物轨迹插补与不确定性量化:深度学习在生态运动模式重建中的应用

【字体: 时间:2025年08月04日 来源:Environmetrics 1.7

编辑推荐:

  本文创新性地将条件扩散模型(conditional diffusion model)应用于动物轨迹数据插补领域,首次实现了对不规则采样轨迹的生成式建模。该方法通过整合多动物观测数据和环境协变量(如NLCD土地分类),显著优于传统线性插值和连续时间相关随机游走(CTCRW)模型,在威斯康星州雌鹿轨迹案例中,MAE降低10-20米,并首次提供概率化插补结果(CRPS优化15%)。研究为生态行为分析、栖息地利用评估等提供了兼具精度和不确定量化的新工具。

  

ABSTRACT

动物运动轨迹中的缺失数据插补对理解未观测期间的行为模式至关重要。传统线性插值和连续时间相关随机游走(CTCRW)模型难以捕捉复杂运动特征。本研究开发的条件扩散模型深度学习方法,利用观测数据和外部协变量进行轨迹插补,在威斯康星州雌鹿案例中不仅实现更精确的确定性插补,还通过概率化插补完成不确定性量化。

1 Introduction

GPS遥测技术记录的动物空间位置数据是研究栖息地利用、迁徙路线和动物-环境相互作用的核心。传统插补方法存在明显局限:线性插值过于简化运动动态;隐马尔可夫模型和状态空间模型需要专家预设参数;随机森林和LSTM等深度学习方法缺乏不确定性量化且难以处理不规则时间间隔。本研究提出的条件扩散模型突破这些限制,首次实现多动物轨迹信息共享的生成式建模。

2 Model

2.1 轨迹数据表示

定义包含Nt个时间点的轨迹矩阵X∈RNt×2,观测掩码M∈{0,1}Nt,协变量矩阵C∈RNt×d。通过人工掩码将观测数据划分为条件部分Xcond和目标部分Xtarget,建立从Xcond预测Xtarget的学习框架。

2.2 条件扩散模型

构建T步扩散过程,潜在变量z1:T通过马尔可夫链转换。前向过程q(zt|zt-1)采用固定线性噪声计划,逆向过程pθ(zt-1|zt,Xcond)通过神经网络参数化。通过证据下界(ELBO)优化,关键推导显示潜在变量可表示为zt=√??α?tXtarget+√(1-αt)ε,其中αt=∏s=1t(1-βs)。

2.3 模型训练

采用随机梯度下降优化KL散度损失函数,设置T=1000步,βt从10-4线性增加到0.02。神经网络架构整合时间嵌入、扩散步嵌入和协变量嵌入,通过1D卷积和Transformer层捕获时空依赖。

2.4 轨迹插补

实际应用时将观测掩码直接作为条件掩码,通过逆向扩散过程生成多组插补样本。图1展示完整流程:将含缺失值的双变量时间序列分解后,用训练好的神经网络从噪声中重建缺失值。

3 Case Study

3.1 数据与评估

分析威斯康星州402只雌鹿的GPS数据(4小时间隔),包含景观特征(NLCD分类)和时间变量。设置20%/50%/80%缺失比例,以MAE和CRPS评估性能。

3.2 模型实现

固定轨迹长度L=72(约12天),通过最小-最大归一化处理坐标。神经网络输入包含噪声目标轨迹、条件轨迹、掩码和时间间隔长度,输出维度与目标轨迹相同。

3.3 对比方法

CTCRW方法通过OU过程建模速度,状态空间框架下用卡尔曼滤波进行插补;线性插值直接连接相邻观测点。

3.4 结果

如表1所示,条件扩散模型在20%/50%/80%缺失率下MAE分别为123/136/164米,显著优于CTCRW和线性插值。图3-5显示该方法能更好捕捉运动周期性和趋势,且不确定性带更合理。

3.5 协变量重要性

如表2所示,加入时间和景观协变量使80%缺失率下的MAE降低12米,证明环境信息对高缺失率场景尤为重要。

4 Conclusions

该条件扩散模型框架突破传统单动物建模限制,实现多动物轨迹信息共享的概率化插补。未来可扩展方向包括:1)用图神经网络建模个体互动;2)整合栖息地约束等生态先验知识;3)构建混合机制模型与数据驱动框架的集成系统。研究为动物迁徙走廊识别、栖息地选择分析等提供新工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号