基于Tucker分解的快速时空张量自回归模型在共享出行需求预测中的应用与性能优化

【字体: 时间:2025年06月21日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  为解决共享出行需求预测中高维数据计算复杂度高、传统方法难以捕捉多维依赖关系的问题,研究人员提出基于Tucker分解的时空张量自回归模型(T-STAR)。该模型通过张量结构化建模和低秩分解,在保留95%以上时空关联性的同时,将预测误差降低20-30%,并在TaxiBJ数据集上实现0.35秒的实时预测速度,较AGCRN和DCRNN分别提速87%和99.8%。这项研究为城市交通智能调度提供了高效可扩展的解决方案。

  

在城市交通日益拥堵的今天,共享出行以其灵活性和环保特性成为解决"最后一公里"难题的关键方案。然而,这种新型交通模式面临着需求预测的严峻挑战——传统时间序列模型难以捕捉共享单车、网约车等服务的复杂时空交互,而深度学习方法又常陷入计算效率与预测精度的两难困境。更棘手的是,真实场景中的出行数据往往呈现高维度(涉及空间网格、时间片、交通模态等多重维度)、强非线性(如早晚高峰的突变需求)和稀疏性(偏远区域低频使用)等特征,使得现有模型要么牺牲精度换取速度,要么因计算资源过载而失去实用价值。

针对这一行业痛点,清华大学的研究团队在《Engineering Applications of Artificial Intelligence》发表创新成果,提出名为T-STAR(Tucker Decomposition-based Spatiotemporal Tensor Autoregressive Model)的新型预测框架。该研究通过将交通数据重构为高阶张量,并引入Tucker分解(一种将高维张量拆解为核心张量与因子矩阵的多线性代数技术),成功实现了预测精度与计算效率的双重突破。在北京出租车轨迹数据集(TaxiBJ)的测试中,模型仅用0.35秒就完成预测,比主流图神经网络快87倍以上,同时将平均绝对误差(MAE)降至23.53,较基线方法提升18.5%。

研究团队采用三大关键技术路线:首先将原始GPS轨迹、天气、POI等多源数据构建为"空间×时间×模态"的三阶张量;随后运用Tucker分解将原始张量Xt≈Gt ×1 U(1)×2 U(2)×3 U(3)(其中Gt为核心张量,U(n)为因子矩阵),实现数据降维;最后扩展传统时空自回归模型(STAR)至张量形式,建立包含空间权重ωij和时间权重dik的联合优化目标函数。

方法创新部分揭示,T-STAR通过张量展开(tensor unfolding)将三维时空数据转换为矩阵序列,利用交替最小二乘法(ALS)求解核心张量Gt∈RR1×R2×R3(Rn?In)和正交因子矩阵,使参数规模从传统方法的O(N3)降至O(N2)。理论分析证实,该分解保留超过95%的原始数据方差,显著优于传统SVD(奇异值分解)的70-85%保留率。

数据集验证显示,在纽约自行车共享(NYCbike)这类稀疏数据场景下,T-STAR仍保持MAE 7.95的稳定表现。特别值得注意的是,模型对突发事件的响应能力:在暴雨天气导致骑行量骤降50%的测试案例中,其预测误差波动幅度比LSTM(长短期记忆网络)低32%,这得益于张量结构对跨模态关联(如天气-时段-区域的三重交互)的显式建模。

讨论环节指出,该研究的突破性在于首次将Tucker分解的维度约简优势与STAR模型的时空建模能力相结合。相比需要数万次迭代训练的图卷积网络,T-STAR通过单次分解即可提取时空特征,计算耗时与数据规模呈线性而非指数关系。作者团队进一步开源了核心算法模块,为智慧城市建设提供可复用的技术基础设施。

这项研究不仅为共享出行平台提供了分钟级响应能力的预测工具,其方法论意义更在于:为处理智慧城市中普遍存在的多维时空数据(如空气质量监测、流行病传播模拟等)建立了新的分析范式。正如论文结论强调,当城市数字化进程产生越来越多"空间×时间×社会维度"的立体数据时,T-STAR展现的"张量思维"将成为破解高维诅咒的关键密钥。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号