
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于近似加法器的离散Haar小波变换架构优化及其在高能效图像压缩重建中的应用
【字体: 大 中 小 】 时间:2025年07月16日 来源:Future Generation Computer Systems 6.2
编辑推荐:
研究人员针对图像处理中高能耗和硬件资源受限的问题,创新性地将近似加法器(AxAs)整合到离散Haar小波变换(DHWT)及其逆变换(IDHWT)硬件架构中,实现了在0.5和0.25 bpp(bits per pixel)压缩率下PSNR达47.85 dB、SSIM>0.99的高质量重建,同时通过FPGA/ASIC验证将关键路径延迟降至0.33 ns,能耗降低99.10%,为边缘计算和医疗影像处理提供了高效解决方案。
在数字化浪潮席卷全球的今天,图像数据正以爆炸式速度增长,从社交媒体到医疗影像,海量数据的传输和处理成为制约技术发展的瓶颈。尤其在高分辨率医学图像领域,传统压缩技术往往面临"鱼与熊掌不可兼得"的困境——要么牺牲图像质量换取传输效率,要么保证诊断精度却导致能耗激增。这一矛盾在资源受限的便携式医疗设备和远程会诊系统中尤为突出,就像给急诊医生戴上了模糊的眼镜,既延误诊断又消耗宝贵电力。
面对这一挑战,研究人员将目光投向了已有百年历史的Haar小波变换。这个由数学家Alfred Haar在1909年提出的方法,因其仅用0、1、-1三个数值构建变换矩阵的极致简洁性,在硬件实现上具有先天优势。但传统精确计算方式仍存在冗余功耗,就像用精密天平称粗盐,造成了不必要的能源浪费。为此,研究人员创造性地将近似计算理论引入小波变换架构,通过允许可控的计算误差来换取能效的显著提升。
这项发表在《Future Generation Computer Systems》的研究,开发了融合多种近似加法器(AxAs)的离散Haar小波变换(DHWT)及逆变换(IDHWT)硬件架构。研究采用层次化设计策略,首先通过2×2核将图像分解为低频近似系数(LL)和高频细节系数(LH、HL、HH),其中LL系数承载主要视觉信息,而高频系数则通过近似加法器进行有损计算。关键技术包括:近似并行前缀加法器(AxPPA)的位宽可调设计、基于K参数的动态精度控制(1≤K≤W)、以及SRAM缓冲的并行流水线架构,在FPGA和ASIC平台上实现了0.33 ns的关键路径延迟。
DHWT和IDHWT硬件架构提案
研究团队设计的二维处理核将传统矩阵运算转化为硬件友好的并行结构。特别在IDHWT重建阶段,通过近似加法器的级联配置,使高频细节系数的计算功耗降低83%,而视觉敏感的低频通道仍保持精确计算。这种"抓大放小"的策略,好比用素描技法处理背景而用工笔刻画主体,既保持整体质量又节省笔墨。
探索DHWT和IDHWT中的近似加法器
六类近似加法器(AxPPA、COPY、TRUNC、NBT、LOA、ETA)在K=4时展现出最佳能效比。其中AxPPA在0.5 bpp压缩率下,仅引入0.15 dB的PSNR损失却节省68%功耗;而LOA加法器对HH系数的近似处理,使芯片面积减少42%。这种可控误差机制,类似于人眼对高频噪声的自然滤波特性,在硬件层面实现了"视觉无损"的优化。
相关工作对比
与3D仿射变换等先进算法相比,该架构在保持PSNR>40 dB的前提下,将能效提升两个数量级。特别在乳腺X光片重建测试中,SSIM维持在0.97以上,满足医学诊断的临床要求,同时使可穿戴设备的续航时间延长15倍。
结论
这项研究通过算法-架构协同创新,证明了近似计算在图像压缩领域的巨大潜力。当K=3时,系统在0.25 bpp超低码率下仍能保持40 dB的PSNR和0.9的SSIM,而99.1%的能耗降幅为移动DR(数字X光机)等设备提供了实用化解决方案。未来,这种"以精度换能效"的设计范式,或将在超声成像、内窥镜视频等实时性要求高的医疗场景引发技术革新。
生物通微信公众号
知名企业招聘