基于双分支预测网络与混合模式决策的VVC快速CU划分算法研究

【字体: 时间:2025年07月01日 来源:Displays 3.7

编辑推荐:

  为解决VVC/H.266标准中QT-MTT(四叉树嵌套多类型树)划分结构导致的高编码复杂度问题,研究人员提出了一种基于轻量化双分支卷积神经网络(DB-CNN)和混合模式决策的快速CU划分算法。该算法通过分离预测QT与MTT划分边界概率,并结合轻量梯度提升机(LGBM)优化候选模式选择,实验表明其可将SDR视频编码复杂度降低40.08%-57.34%,BDBR(Bj?ntegaard Delta比特率)仅增加0.38%-1.22%,同时适用于360度视频压缩,为高效视频编码提供新思路。

  

随着4K/8K超高清视频和360度虚拟现实内容的普及,视频编码技术面临巨大挑战。传统高效视频编码标准HEVC/H.265已无法满足需求,新一代VVC/H.266通过引入QT-MTT划分结构显著提升压缩效率,但编码复杂度激增至HEVC的31倍。如何在保持压缩性能的同时降低复杂度,成为亟待解决的核心问题。

针对这一难题,重庆理工大学的研究团队在《Displays》发表论文,提出了一种创新的两阶段快速CU划分算法。研究首先构建大规模数据集训练轻量化DB-CNN模型,分离预测32×32 CU及其子块的QT与MTT划分概率;随后设计混合决策方案,对32×32 CU采用LGBM选择前2种候选模式,对小尺寸CU基于阈值筛选MTT划分。实验验证该算法对SDR视频可实现40.08%-57.34%的复杂度降低,BDBR仅微增0.38%-1.22%,在360度视频中同样表现优异。

关键技术包括:1) 基于VTM(VVC测试模型)构建训练数据集;2) 设计双分支CNN分别学习QT和MTT划分特征;3) 结合LGBM机器学习与统计阈值实现混合模式决策;4) 在SDR和ERP格式360度视频上验证性能。

研究结果

  • QT-MTT结构分析:发现MTT禁用虽降低93.6%复杂度,但导致26.1% BDBR损失,凸显优化必要性。
  • DB-CNN预测:通过分离QT/MTT分支和4×4边界概率预测,较单模型提升划分准确性。
  • 混合决策方案:32×32 CU采用LGBM选模,小尺寸CU基于概率阈值筛选,平衡效率与性能。
  • SDR视频测试:复杂度降低最高达57.34%,BDBR损失不足1.22%,优于传统特征提取方法。
  • 360度视频验证:复杂度降幅43.69%-57.31%,BDBR增加0.37%-0.84%,证明算法普适性。

结论与意义
该研究首次通过分离建模QT/MTT划分特性与混合决策策略,实现了VVC编码效率与复杂度的优化平衡。DB-CNN的轻量化设计使其易于部署,而LGBM与阈值决策的结合提升了模式筛选精度。成果不仅为SDR视频实时编码提供解决方案,更为360度视频压缩这一新兴领域树立技术标杆。研究获得国家自然科学基金等支持,相关方法有望融入下一代VVC编解码器,推动超高清视频产业发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号