
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双向角度特征融合与扩散模型质量感知的光场图像无参考质量评价
【字体: 大 中 小 】 时间:2025年06月22日 来源:Displays 3.7
编辑推荐:
为解决光场图像(LFI)在成像和处理过程中出现的空间失真与角度不一致性问题,宁波大学团队提出结合双向角度特征融合(BAFF)和扩散模型质量感知(DMQP)的无参考质量评价方法。该研究通过多尺度特征回归和伪参考图像生成,显著提升质量预测与人类视觉感知的一致性,实验验证其在多个数据集上优于现有方法,为LFI处理系统优化提供新工具。
在虚拟现实和三维重建领域,光场图像(Light Field Image, LFI)因其能同时记录光线强度和方向信息而备受关注。然而,这种高维数据在采集、压缩和重建过程中易产生空间失真和角度不一致性,严重影响用户体验。传统质量评价方法依赖参考图像,而实际应用中参考图像往往难以获取。现有无参考评价方法(NR-LFIQA)存在角度特征提取不充分、伪参考图像质量低等瓶颈,亟需突破性解决方案。
宁波大学的研究团队在《Displays》发表论文,提出融合双向角度特征融合(Bidirectional Angular Feature Fusion, BAFF)和扩散模型质量感知(Diffusion Model-based Quality Perception, DMQP)的创新方法。该方法通过Mamba架构提取水平/垂直双向角度特征,结合多尺度回归策略和扩散模型生成高保真伪参考图像,最终加权融合初始质量分数与感知质量分数。实验表明,该模型在多个LFIQA数据集上性能超越现有方法,与人类主观评价相关性达0.92以上。
关键技术包括:(1)基于Mamba的BAFF模块实现双向角度特征解耦与融合;(2)多尺度质量回归(MSQR)模块自适应加权不同尺度特征;(3)DMQP模块通过扩散模型生成伪参考图像并计算感知差异。研究采用宁波大学自建数据集及公开数据集Win5-LID、SHU-LF进行验证。
BAFF模块设计
通过分解EPI(Epipolar Plane Image)特征至水平/垂直方向,采用双向LSTM捕获角度连续性,特征融合阶段引入注意力机制。实验显示该模块对角度畸变的敏感度比传统方法提升37%。
MSQR模块优化
构建金字塔结构提取空间-角度多尺度特征,通过可学习权重参数实现全局-局部特征动态整合。消融实验证实该模块使预测误差降低21%。
DMQP模块创新
利用扩散模型逐步去噪生成伪参考LFI,结合LPIPS(Learned Perceptual Image Patch Similarity)计算感知质量分数。与GAN相比,生成的伪参考图像PSNR提高4.2dB。
综合性能验证
在跨数据库测试中,该方法的SROCC(Spearman Rank Order Correlation Coefficient)均值达0.89,显著优于单流网络(0.72)和多流网络(0.81)。可视化分析表明,其质量热图与人类主观评价区域重合度达85%。
该研究首次将扩散模型引入LFI质量评价领域,提出的BAFF-DMQP框架为高维视觉数据质量评估提供新范式。其创新性体现在:(1)突破传统方法对参考图像的依赖;(2)通过双向角度分析解决多流网络特征提取粗放问题;(3)扩散模型生成的伪参考图像更符合人类视觉特性。这项工作不仅推动LFI处理系统的优化升级,对VR/AR、医学影像等领域的质量评价体系构建也具有重要参考价值。作者团队指出,未来可探索时空联合特征建模,进一步提升动态光场视频的评价精度。
生物通微信公众号
知名企业招聘