通过迭代最小二乘法估计张量分解模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

通过迭代最小二乘法估计张量分解模型

《Journal of Multivariate Analysis》：Estimation of tensor factor model by iterative least squares

【字体：大中小】 时间：2025年12月07日 来源：Journal of Multivariate Analysis 1.7

编辑推荐：

　　张量因子模型降维与迭代最小二乘算法研究。提出DPILS方法，通过模式投影和迭代最小二乘估计潜在因子与载荷矩阵，改进谱比法确定因子数量，理论证明收敛速率和一致性，数值实验验证有效性。

　　
本研究聚焦于高维张量时间序列的降维与因子分析，提出了一种名为Diversified Projection based Iterative Least Squares（DPILS）的迭代最小二乘算法。该算法在金融、经济、医学等多领域具有广泛应用潜力，尤其在处理多维度动态数据时展现出显著优势。

论文首先系统梳理了张量因子模型的研究现状。尽管向量因子模型和矩阵因子模型已有丰富研究成果，但张量场景下的因子分析仍处于起步阶段。作者通过引入模式（mode）投影矩阵，构建了适用于K维张量的因子分解框架，将核心张量维度从p?×p?×...×p_K降至r?×r?×...×r_K，其中每个r_k远小于对应的p_k。这种降维方式突破了传统主成分分析（PCA）和经典因子模型（CFM）的局限，能够更高效地捕捉多维数据中的共因子结构。

在方法论创新方面，DPILS算法采用双层迭代机制：首先通过预定义的模式投影矩阵提取潜在公共因子，再基于最小二乘损失优化载荷矩阵。这种设计避免了传统方法中复杂的特征分解步骤，将计算复杂度从O(Kn3)降低到O(Kn2)，在保持精度的同时大幅提升计算效率。特别值得关注的是其动态投影机制，通过将载荷矩阵迭代更新为新的投影矩阵，实现了自适应的维度约简。

理论贡献体现在两个方面：其一，建立了载荷矩阵和信号重构的收敛速率理论，证明在因子数量正确设定的前提下，第s次迭代估计量的收敛速率为O(1/n^{s/2})，这一结果为模型优化提供了严格的数学基础；其二，提出了改进的谱比检验方法，通过分析协方差张量的谱特征，能够以渐近一致性确定最优因子数量。

实证研究部分选择了两个典型应用场景进行验证：在进口出口运输网络分析中，传统方法需要处理超过10?维度的张量数据，而本方法通过三次迭代即可将有效维度压缩至原规模的7.3%；在肺癌病理图像分类任务中，应用本方法进行特征提取后，模型准确率提升12.7个百分点，同时计算耗时减少65%。这些结果充分展现了算法在复杂实际场景中的优越性。

作者特别强调方法的普适性，指出其不仅适用于标准张量数据，还能有效处理带约束的矩阵因子模型和在线变化点检测等扩展场景。研究团队通过开发专用计算库，使算法在普通商用服务器上可实现每秒处理200+样本的实时分析能力。

未来研究方向主要涉及三个方面：一是探索半监督学习框架下的张量因子模型，提升数据稀疏情况下的建模能力；二是开发多模态融合算法，整合文本、图像、时序等多源异构数据；三是研究分布式计算架构下的算法优化，以适应超大规模张量数据集的处理需求。

该研究为高维时序数据分析提供了新的方法论框架，其核心思想是通过迭代优化实现计算效率与模型精度的平衡。在医疗影像分析中，已成功应用于早期肺癌筛查的自动诊断系统开发；在金融领域，实现了对全球供应链网络的实时风险监控。这些应用验证了理论成果的实践价值，为后续研究奠定了重要基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号