
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于课程学习的可瘦身跨分量预测网络在视频编码中的高效应用
【字体: 大 中 小 】 时间:2025年09月06日 来源:Neurocomputing 6.5
编辑推荐:
本文提出了一种基于课程学习的注意力机制可瘦身跨分量预测网络(SCCPN),通过动态调整网络容量解决传统方法对平坦纹理数据过拟合、复杂纹理数据欠拟合的问题。该网络结合H.266/VVC(多功能视频编码)标准,在Y/Cb/Cr分量上分别实现最高-0.62%/-3.34%/-2.68%的BD-rate增益,其编码/解码复杂度低于现有神经网络方法,为UHD/HDR/VR等新兴视频格式提供高效压缩方案。
Highlight亮点
• 设计基于注意力机制的可瘦身神经网络,擅长挖掘空间与跨分量相关性。通过可瘦身卷积实现多内容数据的联合优化,训练后能以不同容量执行,产生差异化预测结果。
• 提出结合可瘦身卷积的课程学习策略,仅需少量参数即可提升对复杂数据的预测精度和泛化能力。
• 开发自适应搜索策略加速可瘦身卷积的维度选择,在不影响性能前提下进一步降低编码复杂度。
• 实验表明相比H.266/VVC基准,在Y/Cb/Cr分量分别实现-0.62%/-3.34%/-2.68%的BD-rate提升,性能超越现有最佳(SOTA)跨分量预测方法。
Proposed method研究方法
本节首先概述可瘦身神经网络架构(如图2),随后提出结合可瘦身卷积的课程学习策略,通过渐进式训练增强对复杂数据的预测能力。最后引入自适应搜索方法,优化SCCPN选择流程以降低编码复杂度。
Experiment results and analysis实验分析
详细说明训练测试设置后,评估本方法在H.266/VVC基准上的表现,并与SOTA学习型跨分量预测方法对比。进一步展示在增强压缩模型(ECM)上的性能,辅以消融研究和可视化分布实验。
Conclusion结论
本文提出的经济型可瘦身神经网络通过动态参数调整生成差异化预测结果,结合创新训练策略显著提升网络性能。配套的简化方案使编解码复杂度仅增长0.3%/0.8%,为新一代视频压缩技术提供实用解决方案。
生物通微信公众号
知名企业招聘