
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Mamba协同KAN的水下立体匹配新范式MK-IGEV:突破散射衰减瓶颈的高精度三维成像
【字体: 大 中 小 】 时间:2025年09月11日 来源:Optics & Laser Technology 4.6
编辑推荐:
本刊推荐:该研究针对水下立体匹配中特征失真与光散射衰减难题,创新性融合状态空间模型(SSM)与科尔莫戈罗夫-阿诺德网络(KAN),提出MK-IGEV框架。通过MambaExtractor模块实现退化特征的自适应空间关联,结合ResUKAN模块显式建模光衰减物理规律,在多个基准测试中以仅15.47M参数量达到最优性能,为水下自主作业系统提供高精度三维视觉解决方案。
Highlight
(1) MK-IGEV网络:本研究首次在IGEV-Stereo架构中整合状态空间建模与可解释函数逼近理论,通过协同双模块设计显著提升水下双目视觉匹配精度与鲁棒性,为复杂水下环境提供高效立体匹配解决方案。
(2) MambaExtractor特征提取模块:通过将SSM的选择性扫描机制创新性引入立体匹配网络,基于MambaVision架构设计的该模块通过动态权重调整实现全局上下文建模,有效弥补传统CNN在长程依赖建模中的局限性,大幅提升退化水下图像的特征表征能力。
(3) ResUKAN成本聚合模块:本研究通过将残差学习与KAN相结合开发ResUKAN模块,通过将KAN嵌入增强型3D UNet架构,既保留残差学习优势又发挥KAN的显式数学建模能力,增强成本聚合可解释性并显著降低高误差区域的视差估计误差。
Methodology
本研究包含四个主要流程(图1)。在数据准备阶段,采用视差引导的水下降质建模方法,对公开立体匹配数据集Scene Flow和Middlebury 2021进行水下图像合成,获得UW-Scene Flow和UW-Middlebury 2021。同时引入真实水下数据集FLSea,使用定制双目系统在真实海洋环境中采集立体图像。
Underwater image generation
基于学习的立体匹配方法高度依赖训练数据质量与规模。依赖实验室捕获和人工标注的传统数据构建方法存在两大局限:人工标注成本高且质量难统一,受限实验室环境无法完全复现真实水下环境的光学干扰特性。受文献[39]启发,本研究...
Stereo camera and calibration
本研究采用表1所述参数的立体相机配置采集工程水下立体图像数据集,该配置确保在各种水下条件下获取高质量立体图像,支持后续水下立体匹配实验。
本研究使用12×9棋盘格标定板(网格尺寸6mm)采集近距离水下标定图像。
Conclusion
本研究提出针对退化水生环境的MK-IGEV水下立体匹配框架。基于IGEV-Stereo架构整合状态空间建模与可解释函数逼近,实现水下降质过程的显式建模。MambaExtractor模块引入选择性扫描策略构建空间动态关联,克服传统CNN的长程依赖限制并增强退化特征的鲁棒表征。ResUKAN模块通过基于三次B样条的KAN实现物理规律与数据驱动的协同优化,显著提升模型决策可追溯性。在合成与真实数据集上的实验证明该方法在参数效率与估计精度方面的优越性,为水下高精度视觉测量提供可靠技术支撑。
生物通微信公众号
知名企业招聘