基于改进U-Net的多尺度煤矸石图像分割模型RCPU-Net:解决不均匀光照下的背景粘连与半遮挡挑战

【字体: 时间:2025年07月20日 来源:Digital Signal Processing 2.9

编辑推荐:

  针对煤矸石分选中因形态差异小、光照不均导致的背景粘连与半遮挡问题,研究人员提出RCPU-Net模型。该模型以U-Net为框架,结合ResNet50主干网络、小波卷积(WTConv)和膨胀残差模块(DCRM),引入CP注意力机制与线性插值融合模块(LIFM),在煤矸石数据集上实现mIoU 91.84%、mPA 96.20%,较基线模型提升1.44%和1.24%,为工业分选提供高效解决方案。

  

在煤炭开采和利用过程中,煤矸石作为主要固体废弃物,其不当处理不仅降低资源利用率,还会引发土壤重金属污染、有毒气体排放等环境问题。传统人工分选方法效率低且易受主观影响,而基于机器视觉的自动化技术成为研究热点。然而,实际工业场景中煤与矸石形态差异微小、光照不均、多目标粘连及半遮挡等复杂条件,导致现有目标检测算法(如YOLO系列)和语义分割模型(如U-Net)难以实现精准分割,严重影响分选效果。

针对这些挑战,国内某研究机构的研究人员开发了RCPU-Net模型,通过多尺度特征融合和边界优化技术,显著提升了煤矸石分割精度。相关成果发表于《Digital Signal Processing》,为解决工业分选中的关键难题提供了新思路。研究团队采用三项核心技术:1)以ResNet50为骨干网络,在辅助特征提取模块中用小波卷积(WTConv)替代标准卷积,增强边缘信息捕获;2)结合混合膨胀卷积(HDC)准则构建膨胀残差模块(DCRM),并嵌入串行CP(通道-像素)注意力机制,扩大感受野的同时保留细节;3)在上采样阶段设计线性插值融合模块(LIFM),通过SE-Hardswish激活函数优化特征融合。

研究结果显示,RCPU-Net在煤矸石数据集上的性能全面超越对比模型。具体而言:

  1. 模型结构优化:通过WTConv实现多频带特征分解,使LL低频分量与LH/HL/HH高频分量协同作用,边界分割Dice系数提升至89.3%。
  2. 注意力机制对比:CP注意力机制以2.10M参数量实现最优性能(mIoU 89.3%),较SE、CBAM等传统方法降低20%计算开销。
  3. 多场景验证:在光照不均、半遮挡等复杂条件下,模型mIoU达91.84%,较原始U-Net提升45.41%,推理速度达315.8 FPS,满足实时分选需求。

讨论部分指出,该研究的核心价值在于针对性解决了工业场景中的三大痛点:1)通过WTConv与LIFM模块缓解背景粘连导致的边界模糊;2)利用DCRM的混合膨胀卷积(r1=2, r2=4)有效捕捉多尺度目标;3)CP注意力机制通过通道重加权(CAc)和像素级调整(PA)显著降低漏检率。值得注意的是,模型仅需15.2G FLOPs的计算成本,较TransUNet等方案降低94%,为嵌入式设备部署提供可能。

这项研究不仅推动了矿物分选技术的智能化发展,其提出的多尺度特征融合框架(如HDC准则下的膨胀卷积配置)和轻量化注意力设计(CP模块)也为其他工业检测场景提供了普适性方法论。未来工作可进一步探索模型在动态输送带环境中的鲁棒性优化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号