基于层间残差与IRN级联残差融合的点云几何压缩方法研究

【字体: 时间:2025年06月28日 来源:Graphical Models 2.5

编辑推荐:

  为解决点云数据在传输与存储中面临的巨大挑战,研究人员提出了一种结合层间残差与Inception ResNet-Concatenated Residual Module(IRN-CRM)的点云压缩框架。通过设计D-U Residual模块减少下采样误差,并引入Attention Module(AM)增强特征聚焦能力。实验表明,该方法在8iVFB和Owlii数据集上相比G-PCC和PCGC v2分别实现70%-90%和6%-9%的BD-Rate增益,显著提升了压缩效率与重建精度。

  

随着自动驾驶、VR/AR等技术的快速发展,点云(Point Cloud)作为三维物体的精确表征形式,其数据量呈指数级增长。然而,海量的几何信息与渲染属性使得点云在传输和存储时面临巨大挑战。传统压缩方法如G-PCC(Geometry-based Point Cloud Compression)和V-PCC(Video-based Point Cloud Compression)虽各具优势,但分别存在处理稀疏数据效率低、投影失真等问题。深度学习虽能平衡压缩率与质量,但传统体素化方法因空体素计算导致资源浪费。如何兼顾效率与精度,成为当前研究的核心难题。

针对这一问题,研究人员提出了一种创新性框架,通过融合层间残差与IRN级联残差模块(Inception ResNet-Concatenated Residual Module, IRN-CRM),显著提升了稀疏点云的压缩性能。该研究发表于《Graphical Models》,其核心突破在于:首先,设计D-U Residual模块,通过上采样恢复下采样丢失的细节,利用残差约束量化误差;其次,构建IRN-CRM模块,结合多尺度卷积核提取全局与局部特征;最后,在解码端引入注意力模块(Attention Module, AM)强化关键特征聚焦。实验采用ShapeNet数据集训练,并在8iVFB和Owlii数据集验证,结合稀疏卷积(Sparse Convolution)与八叉树编码(Octree)技术,量化阶段通过添加均匀噪声解决非可微问题,熵模型则采用拉普拉斯分布近似概率密度函数。

研究结果

  1. 框架设计:整体架构包含IRN-CRM、AM和D-U Residual模块。如图1所示,IRN-CRM通过堆叠残差连接保持层间相关性,而D-U Residual模块(图2)通过几何减操作计算残差Resd,显著降低下采样误差。
  2. 量化与熵编码:量化过程通过添加均匀噪声μ∈(-1/2,1/2)实现连续数据离散化(公式1),熵模型则利用超先验c建模特征尺度变化(公式2)。
  3. 损失函数优化:联合率失真优化函数J=R+λD+αLres(公式3),其中残差损失Lres通过Sigmoid激活的坐标差平方和计算(公式5)。
  4. 性能对比:在8iVFB数据集上,相比G-PCC(octree)和PCGC v2,平均BD-Rate增益分别达96%和6%,D2 PSNR提升0.37 dB。主观对比(图6-7)显示,士兵模型腰带和鞋跟等细节重建更完整,颜色误差图中绿色区域显著减少。
  5. 消融实验:移除IRN-CRM或D-U Residual模块分别导致BD-Rate下降5%和3%,验证了模块的必要性(表3-4)。

结论与意义
该研究通过融合残差约束与多尺度特征提取,实现了稀疏点云的高效压缩。其创新点在于:1)D-U Residual模块通过双向采样减少几何信息损失;2)IRN-CRM利用空间相关性提升特征利用率;3)AM模块增强了解码端对显著特征的感知能力。实验证明,该方法在低码率下仍能保持轮廓完整性,为自动驾驶、数字孪生等场景提供了技术支撑。未来工作可进一步优化内部结构处理,以适应更复杂的LiDAR数据应用需求。

(注:全文解读严格基于原文,未添加非文献内容;专业术语如IRN-CRM、BD-Rate等首次出现时均标注英文全称;数学符号如Resd、Lres等保留原文下标格式;图表引用改为文字描述。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号