
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于频率引导与渐进对比学习的水下图像复原网络研究
【字体: 大 中 小 】 时间:2025年06月17日 来源:Displays 3.7
编辑推荐:
针对水下图像存在的色偏和低对比度问题,研究人员提出频率引导水下图像复原网络(FGUIR),通过场景再退化数据增强、多尺度特征提取模块(FEM)和频率引导模块(FGM)联合优化,结合渐进对比学习策略,显著提升复原效果。实验表明该方法超越现有技术,为海洋生物研究和无人潜器导航提供高质量视觉数据支撑。
在海洋探索中,水下图像是研究海洋生物和指导潜器导航的关键工具。然而,由于水体对光的吸收和散射作用,这些图像普遍存在颜色失真、对比度下降的问题,严重影响了后续分析的准确性。尽管传统方法如基于模型(model-based)和无模型(model-free)的增强技术取得了一定进展,但它们往往受限于物理模型的简化假设或缺乏对复杂水下环境的适应性。近年来,深度学习技术为水下图像复原(UIR)带来了新思路,但现有方法多聚焦空间域处理,忽略了频率域信息的重要性,且训练数据覆盖场景有限,导致复原效果不稳定。
针对这些挑战,中国的研究团队设计了一种频率引导水下图像复原网络(FGUIR),通过创新性的数据生成和网络架构优化,显著提升了复原性能。研究发表在《Displays》期刊上,其核心贡献包括:首先提出场景再退化方法,通过模拟自然光场渲染复杂水下环境,扩充训练数据多样性;其次构建FGUIR网络,整合特征增强模块(FEM)和频率引导模块(FGM),分别从多尺度特征提取和频域结构稳定性两方面优化复原过程;最后引入渐进对比学习策略,通过动态调整负样本权重压缩解空间,避免过增强现象。
关键技术方法
研究采用三阶段技术路线:1)基于光学特性的场景再退化数据生成,模拟不同水下环境;2)FGUIR网络设计,FEM通过深度可分离卷积(depth-wise separable convolution)提取多尺度特征,FGM利用频域相似性稳定结构重建;3)渐进对比学习框架,通过再退化及其逆变换生成负样本,并设计权重计算规则优化约束条件。实验使用真实和合成数据集验证,并对比现有UIR方法。
研究结果
结论与意义
该研究通过融合频域引导与对比学习,解决了水下图像复原中的色偏和结构失真问题。FGUIR在多项指标上超越现有方法,尤其在复杂场景下表现稳健。其创新性体现在:1)数据生成方法突破真实数据稀缺限制;2)频域与空间域协同优化拓宽了解空间;3)动态对比学习机制为其他图像复原任务提供了新思路。研究成果可直接应用于海洋科考和无人潜器视觉系统,并为多模态图像处理提供理论参考。未来可进一步探索跨域迁移学习和实时性优化方向。
生物通微信公众号
知名企业招聘