基于门控双投影融合的全向图像质量评估模型研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月25日 来源：Displays 3.7

编辑推荐：

　　推荐：为解决全向图像质量评估(OIQA)中单投影特征表示不足的问题，研究人员提出基于门控机制的双投影融合网络(PFOIQA)，通过逐阶段交互融合ERP(等距柱状投影)与CMP(立方体贴图投影)特征，有效缓解变形与边界不连续问题。实验表明该模型在三个公开数据集上预测精度显著提升，为VR应用提供更精准的质量评估工具。

随着虚拟现实(VR)技术的快速发展，全向图像作为核心载体在娱乐、教育等领域广泛应用。然而，这类图像在传输和压缩过程中易产生失真，严重影响用户体验。当前全向图像质量评估(OIQA)模型主要依赖等距柱状投影(ERP)或立方体贴图投影(CMP)作为输入，但ERP存在极区严重变形，CMP则因视口边界不连续导致信息割裂，单一投影难以全面表征图像质量。

针对这一难题，国内某高校（根据致谢部分推测为获国家自然科学基金资助的机构）的研究团队在《Displays》发表创新成果，提出基于门控双投影融合的PFOIQA模型。该模型通过逐阶段分解、编码和融合ERP与CMP特征，利用门控机制(GDPF)动态调节投影间信息交互，显著提升模型表征能力。实验证实其在CVIQ、OIQA等数据集上预测精度优于现有方法，为VR内容质量优化提供新思路。

关键技术包括：1) 构建四阶段网络框架，每阶段含投影分解层、残差特征提取层和GDPF融合层；2) 设计门控机制动态加权ERP与CMP特征，强化关键信息并抑制变形/不连续区域；3) 采用端到端训练策略在三个公开数据库验证性能。

方法论
模型输入为ERP图像，通过投影层分解为ERP与CMP双路径。残差层采用共享权重的ResNet模块提取特征，GDPF模块通过门控单元计算投影间注意力权重，实现像素级特征融合。实验显示该设计使PLCC(皮尔逊线性相关系数)指标提升5.3%。

实验结果
在CVIQ数据库测试中，PFOIQA对JPEG、H.264/AVC和H.265/HEVC压缩图像的SRCC(斯皮尔曼等级相关系数)均值达0.912，较单投影基线模型提高8.7%。可视化分析证实GDPF能有效增强极区细节并修复视口边界断裂特征。

结论与意义
该研究首次实现全向图像质量评估中多投影特征的逐阶段交互融合，门控机制的引入使模型具备动态适应不同失真类型的能力。相比传统仅融合高层特征的方法，PFOIQA通过低层特征交互保留更多细粒度信息，为跨模态视觉质量评估提供普适性框架。未来可扩展至全景视频和光场图像质量评估领域。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号