
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DP-CNN:一种用于视频编码(VVC)帧内编码的深度与分区卷积神经网络
《IEEE Transactions on Consumer Electronics》:DP-CNN: Depth and Partition Convolutional Neural Network for VVC Intra Coding
【字体: 大 中 小 】 时间:2025年12月22日 来源:IEEE Transactions on Consumer Electronics 10.9
编辑推荐:
本文提出两阶段深度与分区卷积神经网络(DP-CNN)用于VVC intra编码,通过D-CNN预测64×64块深度并提前终止率失真优化(RDO),再利用P-CNN提取32×32CU及其子CU的边界特征以预测分区类型,实现编码复杂度降低38.86%-59.69%的同时保持码率增量0.47%-1.50%。
随着视频采集、通信和显示技术的快速发展,用户在教育、娱乐、医疗服务和文化遗产保护等领域越来越依赖超高清和360度视频应用。其中一个关键挑战是传输和存储视频应用产生的大量数据。逐渐地,高效视频编码(HEVC)标准的压缩性能已无法满足不断发展的视频应用需求。为了解决这一问题,ITU-T视频编码专家组(VCEG)和ISO/IEC运动图像专家组(MPEG)于2020年推出了多功能视频编码(VVC)标准。VVC包含了诸如扩展的编码单元(CTU)、具有嵌套多类型树(QTMT)结构的四叉树、自适应滤波以及仿射运动补偿预测等先进技术。与HEVC相比,VVC在保持相同峰值信噪比(PSNR)的情况下可以将比特率降低50% [1]。然而,VVC的计算复杂度显著增加。具体而言,在全帧内(All-Intra,AI)配置下,VVC的平均复杂度是HEVC的18倍 [2]。因此,设计一种适用于VVC的帧内编码算法以降低复杂度并保持视频编码效率至关重要。