
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双分支预测网络与混合模式决策的VVC快速CU划分算法研究
【字体: 大 中 小 】 时间:2025年07月01日 来源:Displays 3.7
编辑推荐:
为解决VVC/H.266标准中QT-MTT(四叉树嵌套多类型树)划分结构导致的高编码复杂度问题,研究人员提出了一种基于轻量化双分支卷积神经网络(DB-CNN)和混合模式决策的快速CU划分算法。该算法通过分离预测QT与MTT划分边界概率,并结合轻量梯度提升机(LGBM)优化候选模式选择,实验表明其可将SDR视频编码复杂度降低40.08%-57.34%,BDBR(Bj?ntegaard Delta比特率)仅增加0.38%-1.22%,同时适用于360度视频压缩,为高效视频编码提供新思路。
随着4K/8K超高清视频和360度虚拟现实内容的普及,视频编码技术面临巨大挑战。传统高效视频编码标准HEVC/H.265已无法满足需求,新一代VVC/H.266通过引入QT-MTT划分结构显著提升压缩效率,但编码复杂度激增至HEVC的31倍。如何在保持压缩性能的同时降低复杂度,成为亟待解决的核心问题。
针对这一难题,重庆理工大学的研究团队在《Displays》发表论文,提出了一种创新的两阶段快速CU划分算法。研究首先构建大规模数据集训练轻量化DB-CNN模型,分离预测32×32 CU及其子块的QT与MTT划分概率;随后设计混合决策方案,对32×32 CU采用LGBM选择前2种候选模式,对小尺寸CU基于阈值筛选MTT划分。实验验证该算法对SDR视频可实现40.08%-57.34%的复杂度降低,BDBR仅微增0.38%-1.22%,在360度视频中同样表现优异。
关键技术包括:1) 基于VTM(VVC测试模型)构建训练数据集;2) 设计双分支CNN分别学习QT和MTT划分特征;3) 结合LGBM机器学习与统计阈值实现混合模式决策;4) 在SDR和ERP格式360度视频上验证性能。
研究结果
结论与意义
该研究首次通过分离建模QT/MTT划分特性与混合决策策略,实现了VVC编码效率与复杂度的优化平衡。DB-CNN的轻量化设计使其易于部署,而LGBM与阈值决策的结合提升了模式筛选精度。成果不仅为SDR视频实时编码提供解决方案,更为360度视频压缩这一新兴领域树立技术标杆。研究获得国家自然科学基金等支持,相关方法有望融入下一代VVC编解码器,推动超高清视频产业发展。
生物通微信公众号
知名企业招聘