
-
生物通官微
陪你抓住生命科技
跳动的脉搏
压缩视频中感知带状伪影的智能检测与自适应消除新方法研究
【字体: 大 中 小 】 时间:2025年06月21日 来源:Signal Processing: Image Communication 3.4
编辑推荐:
研究人员针对视频压缩中常见的带状伪影(banding artifacts)问题,开发了新型无参考质量评估算法BBAND和联合增强框架AdaDeband+UNet。该研究通过感知模型分析伪影特征,实现像素级带状可见性图谱生成,并结合深度学习技术显著提升VP9等编码视频的视觉质量。实验表明,该方法在主观评价和客观指标(PSNR/SSIM)上均优于现有方案,为高动态范围(HDR)视频处理提供了跨领域解决方案。
在当今视频流量占据互联网主导地位的时代,视频压缩技术如H.264/AVC、VP9等虽大幅提升了编码效率,但由此产生的带状伪影(banding artifacts)——表现为平滑区域出现的阶梯状色带——成为影响高清晰度视频观感的重要问题。这类伪影在天空、水面等大面积平滑区域尤为明显,由于人眼视觉系统对梯度变化的敏感性(Mach带效应),即使微小的亮度阶跃也会产生显著的视觉不适。尽管现有质量评估指标如PSNR、VMAF等对块效应和模糊较为敏感,但对带状伪影的检测能力不足,亟需开发专用评估工具和增强方案。
为解决这一挑战,来自Google和德克萨斯大学奥斯汀分校的研究团队开展了系统性研究。通过分析带状伪影的感知特性与编码机制,发现自适应量化模式(aq-mode)虽能缓解伪影但会显著增加码率。研究创新性地提出盲带状伪影检测器BBAND,该模型结合边缘特征提取(Sobel算子)和视觉掩蔽效应建模(包括亮度掩蔽和对比度掩蔽),实现了无参考条件下的伪影可视化图谱生成。进一步开发的AdaDeband滤波器采用可变尺寸平滑核与抖动量化技术,配合轻量级UNet架构(1.82M参数)进行压缩伪影联合去除,形成端到端增强方案。
关键技术方法包括:1)基于Waterloo1K数据集构建VP9压缩数据库(477段1080p视频);2)BBAND检测器的多阶段处理流程(引导滤波预处理→带候选像素分类→边缘可见性估计);3)AdaDeband的高效实现(积分图像优化使复杂度降至O(MN));4)残差学习UNet训练(L1损失函数,128×128随机裁剪)。
研究结果部分显示:
该研究的突破性在于首次建立了从检测到消除的完整带状伪影处理链条。BBAND模型的创新性在于将心理物理学原理(如Mach带效应)转化为可计算的边缘可见性权重,而AdaDeband+UNet框架则通过传统图像处理与深度学习的协同,实现了编码伪影的多维度修复。这些成果发表于《Signal Processing: Image Communication》,不仅为流媒体服务平台提供了实用的质量增强工具,其技术路径对医学影像去噪、卫星图像增强等跨领域应用也具有重要启示。未来工作可探索基于BBAND的实时预处理算法,以及在AV1等新兴编码标准中的适应性优化。
生物通微信公众号
知名企业招聘