
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向复杂地下采矿场景的多视角自适应分层注意力图像增强方法
【字体: 大 中 小 】 时间:2025年06月29日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决地下矿井环境中低光照、雾霾、粉尘及局部眩光导致的视觉感知难题,研究人员提出多视角自适应分层注意力图像增强框架(MvAIE)。该研究通过动态调整伽马校正与HSV色彩空间参数,结合扩张卷积的多视角特征融合(MvFF)和全局-局部注意力机制(MGLA),显著提升图像质量。实验表明该方法在合成采矿数据集上超越现有技术,为智能采矿装备提供可靠环境感知支持。
地下采矿环境如同一个光线扭曲的迷宫,昏暗的灯光穿透悬浮的粉尘形成朦胧光晕,矿车探照灯在岩壁上投下刺目光斑——这些复杂条件让自动驾驶矿车的"眼睛"几乎失明。传统图像增强方法在此类场景中捉襟见肘:基于直方图均衡化(HE)的方法在非均匀光照下失效,Retinex理论难以模拟粉尘散射效应,而暗通道先验(DCP)在矿井眩光前束手无策。更棘手的是,深度学习模型在常规场景的表现也无法直接迁移,因为矿井图像同时存在低照度、高噪声和局部过曝的"三重退化"。
针对这一挑战,中国研究人员在《Expert Systems with Applications》发表的研究提出革命性解决方案。团队构建的多视角自适应图像增强框架(MvAIE)如同给矿车装上智能调光镜片:其自适应模块像人眼虹膜般动态调节伽马值和HSV参数,多视角特征融合(MvFF)模块通过扩张卷积捕获多尺度特征,而分层注意力机制(MGLA)则像聚光灯精准照亮关键区域。亮度调节(BA)模块创新性地采用可学习参数动态平衡全局曝光。
关键技术包括:1) 建立融合雾霾、眩光和低照度的综合退化模型;2) 采用编码器-解码器架构实现多尺度特征提取;3) 设计含扩张卷积的MvFF模块增强细节保留;4) 开发MGLA机制实现关键区域增强;5) 引入可学习亮度权重实现自适应曝光。
【成像退化模型】
通过分析矿井光学特性,建立包含大气散射项、直接眩光和暗电流噪声的物理模型,为合成训练数据提供理论基础。
【整体网络架构】
网络采用三级处理流程:预处理阶段通过并行RGB/HSV分支提取色彩特征;MvFF模块使用3×3和5×5双路径扩张卷积捕获多尺度特征;MGLA机制通过空间和通道注意力加权关键区域。
【实验与讨论】
在合成矿井数据集上,MvAIE的PSNR达到28.7dB,比次优方法提高2.3dB。消融实验显示MGLA模块使语义分割mIoU提升7.8%,证实注意力机制对关键区域增强的有效性。
该研究突破性地解决了矿井环境下的"增强-检测"耦合难题。动态参数调整策略使系统能适应照度突变,多尺度特征融合保留岩石纹理等细节,而注意力机制有效抑制了眩光干扰。值得注意的是,该方法在真实矿井测试中使障碍物检测率提升35%,为无人采矿安全作业树立新标杆。未来通过迁移学习框架,该技术有望拓展至隧道巡检、地下救援等低照度场景,推动智能装备在极端环境的应用边界。
生物通微信公众号
知名企业招聘