
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于改进U-Net的多尺度煤矸石图像分割模型RCPU-Net:解决不均匀光照下的背景粘连与半遮挡挑战
【字体: 大 中 小 】 时间:2025年07月20日 来源:Digital Signal Processing 2.9
编辑推荐:
针对煤矸石分选中因形态差异小、光照不均导致的背景粘连与半遮挡问题,研究人员提出RCPU-Net模型。该模型以U-Net为框架,结合ResNet50主干网络、小波卷积(WTConv)和膨胀残差模块(DCRM),引入CP注意力机制与线性插值融合模块(LIFM),在煤矸石数据集上实现mIoU 91.84%、mPA 96.20%,较基线模型提升1.44%和1.24%,为工业分选提供高效解决方案。
在煤炭开采和利用过程中,煤矸石作为主要固体废弃物,其不当处理不仅降低资源利用率,还会引发土壤重金属污染、有毒气体排放等环境问题。传统人工分选方法效率低且易受主观影响,而基于机器视觉的自动化技术成为研究热点。然而,实际工业场景中煤与矸石形态差异微小、光照不均、多目标粘连及半遮挡等复杂条件,导致现有目标检测算法(如YOLO系列)和语义分割模型(如U-Net)难以实现精准分割,严重影响分选效果。
针对这些挑战,国内某研究机构的研究人员开发了RCPU-Net模型,通过多尺度特征融合和边界优化技术,显著提升了煤矸石分割精度。相关成果发表于《Digital Signal Processing》,为解决工业分选中的关键难题提供了新思路。研究团队采用三项核心技术:1)以ResNet50为骨干网络,在辅助特征提取模块中用小波卷积(WTConv)替代标准卷积,增强边缘信息捕获;2)结合混合膨胀卷积(HDC)准则构建膨胀残差模块(DCRM),并嵌入串行CP(通道-像素)注意力机制,扩大感受野的同时保留细节;3)在上采样阶段设计线性插值融合模块(LIFM),通过SE-Hardswish激活函数优化特征融合。
研究结果显示,RCPU-Net在煤矸石数据集上的性能全面超越对比模型。具体而言:
讨论部分指出,该研究的核心价值在于针对性解决了工业场景中的三大痛点:1)通过WTConv与LIFM模块缓解背景粘连导致的边界模糊;2)利用DCRM的混合膨胀卷积(r1=2, r2=4)有效捕捉多尺度目标;3)CP注意力机制通过通道重加权(CAc)和像素级调整(PA)显著降低漏检率。值得注意的是,模型仅需15.2G FLOPs的计算成本,较TransUNet等方案降低94%,为嵌入式设备部署提供可能。
这项研究不仅推动了矿物分选技术的智能化发展,其提出的多尺度特征融合框架(如HDC准则下的膨胀卷积配置)和轻量化注意力设计(CP模块)也为其他工业检测场景提供了普适性方法论。未来工作可进一步探索模型在动态输送带环境中的鲁棒性优化。
生物通微信公众号
知名企业招聘