一种新型的高效视频编码DCT硬件实现方法

《Microporous and Mesoporous Materials》:A Novel Approximate High Efficiency Video Coding DCT Hardware

【字体: 时间:2026年06月09日 来源:Microporous and Mesoporous Materials 4.7

编辑推荐:

  作者:Hossein Mahdavi、Hasan Azgin、Ilker Hamzaoglu 所属机构:?zye?in大学 摘要 本文提出了一种新的近似常数乘法(ACM)技术。利用这种新技术,设计了一种适用于所有变换单元(TU)尺寸的高效视频编码(HEV

  
作者:Hossein Mahdavi、Hasan Azgin、Ilker Hamzaoglu 所属机构:?zye?in大学

摘要

本文提出了一种新的近似常数乘法(ACM)技术。利用这种新技术,设计了一种适用于所有变换单元(TU)尺寸的高效视频编码(HEVC)二维(2D)离散余弦变换(DCT)硬件。采用该近似技术的ACM硬件将常数乘法(CM)操作转换为乘以一个较小的常数。在所提出的硬件中,ACM仅用于那些平均百分比误差(APE)不超过5%的DCT系数乘法运算。此外,一些常见的常数乘法操作被计算一次,从而减少了乘法次数。与现有的近似HEVC DCT硬件相比,该硬件具有更小的面积、更低的功耗和更高的性能,且质量损失可以忽略不计。在最坏的情况下,所提出的近似硬件的FPGA和ASIC实现分别能够每秒处理76帧和117帧四倍全高清(QFHD)图像。

引言

高效视频编码(HEVC)[1]-[6] 的视频压缩效率比H.264标准高出50%。HEVC和H.264标准都使用了离散余弦变换(DCT)/逆离散余弦变换(IDCT)。H.264仅支持4×4和8×8大小的变换单元(TU),而HEVC支持4×4、8×8、16×16和32×32大小的TU。较大的TU尺寸虽然能带来更好的能量压缩效果,但计算复杂度呈指数级增加。此外,HEVC在特定情况下还使用了离散正弦变换(DST)/逆离散正弦变换(IDST)进行4×4帧内预测。DCT和DST变换的计算量很大,占HEVC全帧内编码器计算负荷的四分之一。
近似计算技术使得硬件设计能够在牺牲一定质量的前提下实现更高的速度、更小的面积和更低的功耗[7]-[12]。因此,它被应用于计算复杂度高且对误差容忍度要求高的场景。文献中提出了多种近似电路[13]-[17],特别是近似加法器和乘法器[18]-[20](匿名作者,2020年,2023年)。
在[匿名作者,2020年]的研究中,我们提出了一种新的近似常数乘法(ACM)技术,用于实现HEVC DCT中的常数乘法操作。在该研究中,HEVC DCT中的所有常数乘法都使用了所提出的ACM硬件。本文基于我们在会议论文[匿名作者,2020年]中的工作,并在博士论文[匿名作者,2023年]中进行了进一步研究。在本文中,ACM仅应用于平均百分比误差(APE)低于5%的DCT系数。所提出的近似HEVC DCT硬件中,一些常见的常数乘法操作被计算一次,其结果被用于多个公式中。Hcub无乘法器常数乘法(MCM)技术[23]被用于实现这些乘法操作。
[24]中利用一维(1D)DCT的可分离性实现了二维(2D)DCT。[24]提出了一种低成本、高吞吐量的HEVC 16×16 2D DCT硬件,但它不支持所有大小的TU。[25]中提出的可变大小HEVC 2D DCT硬件允许在不同DCT尺寸之间共享资源。[26]中的HEVC 2D DCT硬件在计算过程中实现了最大程度的电路复用。然而,[25]和[26]中的硬件需要大量的DSP模块来执行常数乘法操作。[27]中提出了一种基于CORDIC的DCT硬件,该硬件利用矩阵分解、资源共享和合并技术,但仍不支持所有大小的TU。
[匿名作者,2016年]提出了一种用于HEVC DCT的计算和节能方法,以及一种低功耗的HEVC 2D DCT硬件。该方法通过降低计算复杂度来节省能源,但会带来明显的速率失真(RD)性能损失。该方法仅计算部分预定的低频系数,并将剩余系数视为零。[29]中提出了一种8×8正交近似方法,用于获取其他TU尺寸的近似变换结果。该方法利用图像中相邻像素的相关性,通过考虑符号和位置而非数值来量化DCT核的奇数基向量。尽管该硬件支持所有大小的TU,但8×8近似得到的变换结果并未进行独立优化。[30]中提出了一种算法,用于计算HEVC DCT/IDCT中所有TU所需的最小低频系数数量,这会导致信噪比(PSNR)略有下降和比特率略有增加。[30]还提出了一种支持所有HEVC TU尺寸的灵活转置内存架构以及高效的2D DCT/IDCT硬件,但所需系数的最小数量是基于平均PSNR、比特率值和预设阈值离线计算得出的。
本文的其余部分结构如下:第二节回顾了[匿名作者,2020年]提出的使用ACM的近似HEVC DCT硬件;第三节介绍了所提出的近似HEVC DCT硬件并提供了实验结果;第四节总结了研究结论和未来工作方向。

章节摘录

[匿名作者,2020年]提出的ACM和近似HEVC 2D DCT硬件

[匿名作者,2020年]提出了一种ACM技术,通过调整被乘数和常数乘数的值来降低常数乘法的计算复杂度。该技术将常数乘法转换为乘以一个较小的常数、字符串连接和常数移位操作。
公式(1)展示了a位变量A与b位常数B的常数乘法过程。如(2)所示,任何整数常数B都可以进行相应的操作。所提出的技术使用了能够最小化BB值的y和z。

所提出的近似HEVC 2D DCT硬件

在所提出的近似HEVC 2D DCT中,为了减少质量损失,[匿名作者,2020年]提出的ACM技术仅应用于平均百分比误差(APE)低于5%的常数乘法操作。因此,当B=9、18、36、80时,使用ECM进行乘法运算。
一些常数乘法操作被计算一次,其结果被用于多个公式中,从而减少了乘法次数。此外,更多常见的常数乘法操作直接进行计算,进一步降低了计算量。

结论

本文提出了一种新的ACM技术和一种支持所有TU尺寸的近似HEVC 2D DCT硬件。在所提出的硬件中,ACM仅用于APE不超过5%的DCT系数乘法操作,因此其质量损失低于现有近似HEVC 2D DCT硬件。一些常见的常数乘法操作被计算一次,减少了乘法次数。

未引用的参考文献

[[2], [3], [4], [5], [8], [9], [10], [11], [14], [15], [16], 19, 21, 22, 28]

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。

Hossein Mahdavi于2006年在伊朗Azad大学获得电气与电子工程学士学位,2017年在伊朗德黑兰Shahid Beheshti大学获得硕士学位。2023年在土耳其伊斯坦布尔Sabanci大学获得电子工程博士学位。2024年,他在法国ESIGELEC担任博士后研究员。他的研究兴趣包括用于视频处理和编码的数字VLSI设计。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号