基于时序融合Transformer提升海洋动物运动预测区域精度的研究
《Scientific Reports》:Improving prediction region accuracy in marine animal movement with temporal fusion transformer
【字体:
大
中
小
】
时间:2025年12月05日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对海洋动物运动预测精度不足的问题,开发了基于时序融合Transformer(TFT)的深度学习模型,通过对356头南象海豹卫星追踪数据的分析,实现了7天内位置预测和缺失数据插补。结果显示:TFT将定位误差降低15%,预测区域面积缩小5倍(预测任务)和30-40%(插补任务),在近大陆架区域和低速运动时表现最佳。该模型为动态海洋保护提供了新的技术工具,相关代码已在GitHub开源。
在广袤的海洋中,南象海豹等海洋动物的迁徙路线犹如神秘的地下暗河,它们的行为模式蕴含着生态系统健康的重要信息。然而,这些动物运动轨迹的预测始终是海洋生态学的重大挑战——传统方法难以准确预报动物未来位置,更无法有效划定它们可能出现的区域范围。这种预测能力的缺失直接制约着动态海洋保护措施的实施,比如无法及时调整航运路线以避免船舶撞击,难以精准规划海洋保护区边界来应对气候引起的栖息地变化。
长期以来,研究人员主要依赖状态空间模型(SSMs)来研究动物运动。这类模型将运动视为潜在连续过程,能够区分定位误差和真实移动模式,尤其擅长识别动物的行为状态(如觅食、迁徙)。但SSMs在处理大规模、稀疏的追踪数据时显得力不从心,且预测区域(PRs)往往过于保守,覆盖面积过大而实际效用有限。随着卫星追踪技术的普及,海洋动物运动数据正以前所未有的速度积累,迫切需要更强大的分析工具来挖掘这些数据中的价值。
正是在这样的背景下,来自多个研究机构的科学家团队将目光投向了深度学习领域的前沿模型——时序融合Transformer(TFT)。这种基于注意力机制的神经网络在时间序列预测领域已展现出强大潜力,被成功应用于电力网格管理、医疗健康等多个领域。研究人员思考:能否将TFT适配于海洋动物运动预测这一特殊场景,在提高点预测精度的同时,生成更精确的预测区域?
本研究创新性地将TFT模型应用于南象海豹的运动分析,解决了两个关键任务: forecasting(预测)——基于历史轨迹预测未来位置;imputation(插补)——填补轨迹中的缺失数据。团队收集了2005-2019年间434头南象海豹的ARGOS卫星追踪数据,并融合了ERA5、ORAS5等环境数据集,包括水深、水温、海流方向等可能影响动物运动的关键变量。
在技术方法上,研究人员进行了多项创新适配:首先,将经纬度坐标转换为墨卡托投影,并采用6小时间隔对不规则采样的轨迹数据进行标准化处理;其次,针对追踪数据的间断特性,修改了注意力机制,使其仅依赖于已观测的位置;第三,为插补任务引入了双向处理层,可同时考虑缺失窗口前后信息;最后,开发了两种预测区域生成方法——标准TFT基于各坐标分位数生成矩形PRs,而TFT[B]则通过量化尊重密度估计(QRDE)和Gaussian copula构建二元概率密度,生成面积更小的高密度区域(HDR)。
研究的主要技术路径包括:使用OPTUNA进行贝叶斯超参数优化,采用分位数损失函数同时预测多个分位点,通过早停法防止过拟合,并利用验证集对预测区域进行面积校准。模型在NVIDIA RTX 3090 GPU上训练耗时6-16小时,而推理阶段可在CPU上秒级完成,满足实时应用需求。
研究设定了两种数据集划分策略来评估模型性能:时间划分(按时间顺序将80%最早数据作为训练集,10%中间数据作为验证集,10%最新数据作为测试集)和地理划分(将研究区域分为五个地理区域,每次留出一个区域作为测试集)。这种设计既能评估模型基于历史模式预测未来的能力,也能检验其在新地理区域的泛化性能。评估指标包括点预测的距离误差和预测区域质量得分Q,后者综合考虑了覆盖误差率(CER)和区域面积两个维度。
在预测任务中,TFT和TFT[B]表现出色,平均距离误差显著低于所有SSMs模型,较表现最佳的运动持续性(MP)模型降低17%。更重要的是,在预测区域质量方面,TFT仅需MP模型40%的面积即可达到相同的覆盖水平,而TFT[B]更是将这一优势扩大到5倍面积缩减。这表明深度学习模型能生成更加紧凑、高效的预测区域。
在插补任务中,TFT系列模型同样领先,距离误差较最佳SSM(随机游走RW)降低14%。虽然所有模型均未能显著超越朴素模型(Naive),但TFT在预测区域质量上展现明显优势,使用面积减少36-43%。值得注意的是,当仅在单条轨迹上训练时(TFT[s]),模型性能大幅下降,说明TFT需要足够多的训练数据才能发挥优势。
当测试区域完全未出现在训练集中时,所有模型性能均出现下降。TFT在预测任务中的距离误差增加32%,预测质量下降31%;在插补任务中表现更明显,距离误差恶化170%。特别是在测试区域1,误差达到其他区域的4-6倍。这表明模型学习到的运动模式具有一定地域特异性,难以直接迁移到全新环境。
通过分析变量选择权重和SHAP值,研究发现模型主要依赖坐标特征进行预测,环境因子中水深、水温和海流方向影响最大。这与南象海豹生态习性高度一致:它们常在 continental shelf(大陆架)区域觅食,其移动模式与温度和水深剖面密切相关。模型在 continental shelf(深度<1000米)和低中等运动速度(<3公里/小时)条件下表现最佳,此时平均距离误差仅为32公里,而在其他情况下误差增至91公里。
对于插补任务,最关键的特征是插补窗口两端的坐标差异,差异越小预测越准确。此外,点预测误差与预测区域质量呈负相关(Spearman相关系数-0.5至-0.77),说明两者受相似因素影响。性别差异也影响预测性能,雌性海豹的预测区域面积通常更大,这可能与它们冬季向更深水域移动的习性有关。
本研究证实了TFT在海洋动物运动预测中的巨大潜力,特别是在数据充足且地理区域重叠的场景下,其性能显著优于传统SSMs。TFT不仅能提供更精确的点预测,更能生成面积小、覆盖率高的预测区域,为动态海洋管理提供实用工具。模型推理速度快的特点,使其非常适合集成到实时决策系统中,如调整航运路线以避免与保护物种冲突。
然而,研究也揭示了TFT的若干局限性:首先,模型仅能预测固定时间步长的位置,无法像SSMs那样提供连续时间预测;其次,TFT未直接考虑设备定位误差,其精度依赖于追踪数据本身的分辨率和规整性;最重要的是,模型地理泛化能力有限,在全新区域性能下降明显,这与物种分布模型(SDMs)面临的挑战相似。
未来研究方向包括开发神经微分方程(NDEs)模型,结合SSMs的连续时间特性和神经网络的非线性建模能力;添加潜水深度等垂直运动维度数据;以及使用领域对抗神经网络(DANN)减少地理偏差。此外,将模型扩展至多物种应用,通过迁移学习降低数据需求,也是重要的发展方向。
这项发表于《Scientific Reports》的研究,为海洋动物运动预测建立了新基准,展示了深度学习在生态学中的应用前景。随着海洋观测技术的进步和动物追踪数据的持续积累,这类模型有望成为海洋保护决策的核心工具,为构建人与自然和谐共处的蓝色星球提供科学支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号