
-
生物通官微
陪你抓住生命科技
跳动的脉搏
自监督网格增强扩散模型DTIU:无约束场景下轨迹补全的创新突破
【字体: 大 中 小 】 时间:2025年06月13日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对无约束环境下轨迹数据缺失难题,研究人员提出自监督网格增强扩散模型DTIU。该模型通过融合扩散模型与GridFormer模块,创新性地采用网格信息增强策略和掩码语言模型训练方法,有效解决了传统方法依赖路网信息、难以捕捉复杂时空依赖的痛点。实验表明DTIU在四种真实数据集上显著优于现有方法,为海洋、野外等无约束场景的轨迹分析提供了新范式。
在位置服务普及的今天,轨迹数据已成为智慧城市、应急响应等领域的重要资源。然而设备故障、隐私保护等因素导致的数据缺失问题长期困扰着研究者,特别是在缺乏路网约束的野外、海洋等场景中,传统基于城市路网的补全方法往往失效。现有方法面临三大挑战:无约束环境下轨迹模式复杂多变、时空依赖关系难以捕捉、标注数据严重不足。这些瓶颈使得无人机巡检、野生动物追踪等关键应用难以获得高质量轨迹数据。
针对这一难题,中国研究人员在《Knowledge-Based Systems》发表的研究提出了创新解决方案DTIU模型。该研究通过三个关键技术突破:1)构建基于马尔可夫链的扩散模型框架,仅依赖原始轨迹数据即可建模动态空间关系;2)设计GridFormer自编码器,通过自适应网格增强策略捕捉长程时空特征;3)借鉴掩码语言模型的自我监督训练方法,有效缓解数据稀疏问题。研究团队在四个真实数据集上验证了模型性能。
【Method】部分显示,DTIU采用分阶段处理流程:数据预处理阶段进行轨迹变形和掩码切割;前向加噪过程通过马尔可夫链逐步添加噪声;反向去噪过程结合GridFormer的网格编码实现精准补全。GridFormer模块创新性地将轨迹映射到可学习网格空间,通过多头注意力机制融合局部与全局特征。
【Experiment setup】验证环节表明,在船舶航行、鸟类迁徙等无约束场景数据集上,DTIU的均方根误差(RMSE)比最优基线方法降低23.7%。特别是在连续缺失超过50%的极端情况下,仍能保持86.4%的补全准确率。消融实验证实网格增强策略使长程依赖捕捉能力提升41.2%,自监督训练使小样本场景性能提升35.8%。
【Conclusion】部分指出,这是扩散模型首次成功应用于无约束轨迹补全领域。DTIU的创新价值体现在三方面:方法论上首次实现确定性模型与概率模型的协同优化;技术上开创网格编码与扩散模型的融合架构;应用上为开放式环境监测提供了通用解决方案。作者团队特别强调,该框架可扩展至医疗健康领域的不规则生理信号补全,如可穿戴设备的心电信号修复。
研究团队在【CRediT authorship contribution statement】中详细说明了贡献分配,Zhijing Hu负责核心算法设计与实验验证,Hao Yan参与方法论创新,Kuihua Huang等提供理论指导与资源支持。所有作者在【Declaration of competing interest】中声明不存在利益冲突。这项研究获得国家自然科学基金等项目支持,相关代码已开源。
这项研究的突破性在于:首次证明在完全无路网先验的情况下,仅通过轨迹自监督学习就能实现精准补全。相比需要道路拓扑约束的UrbanImpute等方法,DTIU在海洋轨迹数据集上的性能优势达39.2%。GridFormer模块通过64×64
可学习网格将经纬度坐标转化为高维表征,解决了传统CNN难以处理非欧式空间数据的缺陷。研究还发现,扩散模型的渐进式去噪特性特别适合处理轨迹数据中的不确定性,这对处理GPS信号漂移等实际问题具有重要价值。
未来工作将聚焦三个方向:扩展至三维空间轨迹补全、开发增量学习版本以适应动态环境、探索与物理引擎的联合建模。这项研究为自动驾驶、生态保护等领域的轨迹分析提供了新工具,其核心思想也可迁移至其他时空序列预测任务。特别是在应急管理场景中,快速修复灾害现场的断裂轨迹将显著提升救援效率,这凸显了该研究的实际应用价值。
生物通微信公众号
知名企业招聘