
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于DBSCAN聚类优化的时序邻接矩阵在3D人体姿态估计中的降噪与分类研究
【字体: 大 中 小 】 时间:2025年08月12日 来源:Neurocomputing 6.5
编辑推荐:
【编辑推荐】本文创新性地提出基于DBSCAN的时序特征聚类方法,通过检测高维空间中的噪声特征(noisy features)并采用邻接矩阵掩码机制,显著优化Transformer自注意力机制中的时序邻接矩阵(temporal adjacency matrix)。在Human3.6M和MPI-INF-3DHP数据集上实现MPJPE(Mean Per Joint Position Error)最高6.9%的性能提升,为3D姿态估计(3D human pose estimation)中的时序建模提供新思路。
Highlight
我们提出一种简单高效的解决方案,包括时序特征聚类方法和无参数的时序邻接矩阵优化算法,用于连续时序数据中的特征分类与噪声检测。该方法通过聚类结果调整自注意力机制中的时序邻接矩阵,无需增加额外网络参数。
3D人体姿态估计
3D人体姿态估计领域可分为单目与多视角方法。本文聚焦单目3D方法,包括直接估计和2D-3D坐标转换(2D-to-3D lifting)。由于2D关键点检测技术的进步,2D-3D转换方法展现出更强有效性。
Method
我们的方法针对使用时序Transformer的2D-3D转换方法,修改首层时序Transformer的自注意力结构。自注意力机制通过公式计算特征间相关性,其中生成的邻接矩阵(adjacency matrix)是核心。
Datasets and implementation details
实验采用Human3.6M(室内场景标杆数据集)和MPI-INF-3DHP数据集,以MPJPE(关节位置平均欧氏距离,毫米级)作为评估指标。Human3.6M包含11名受试者的17种动作,按Protocol 1(6人训练)和Protocol 2(5人训练)划分。
Conclusion
我们提出的聚类方法能有效检测时序序列中的噪声特征并实现特征分类,通过优化自注意力邻接矩阵消除不应存在的特征间相关性。未来将探索更精细的时序建模与跨模态融合。
(注:翻译严格保留专业术语如DBSCAN、MPJPE等,采用"标杆数据集"等生动表述,省略文献引用标识[39][40]及图示标记Fig.1-2)
生物通微信公众号
知名企业招聘