一种用于分割露天矿道路的新框架
《Engineering Applications of Artificial Intelligence》:A novel framework for segmenting open-pit mining road
【字体:
大
中
小
】
时间:2025年10月22日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
露天矿道路分割中存在边界模糊、弱纹理特征和砾石干扰等问题,本文提出MRS-Net网络,通过ResNetV2-Transformer级联编码器增强局部与全局特征融合,设计RMFF模块实现多尺度特征提取,结合渐进式解码提升边缘平滑度。实验表明在鞍山铁矿UAV数据集上,MRS-Net的IoU达89.4%,Dice系数94.1%,Kappa系数87.2%,优于DeepLabV3+和TransUNet等模型。
在现代采矿工程和智能系统的发展背景下,对露天矿道路网络的精确分割成为实现矿山数字化和自动驾驶应用的关键环节。露天矿的道路系统不仅是矿产运输和设备调度的基础,还对矿区的整体运营和管理起着至关重要的作用。然而,露天矿的道路环境极为复杂,常常受到机械压实、地质侵蚀以及矿石粉尘覆盖等多重因素的影响,导致道路分割结果存在边界模糊、空洞、断裂以及几何变形等问题,严重影响了测量的精度和可靠性。为解决这些挑战,本文提出了一种新的道路分割网络——MRS-Net(Mining Road Segmentation Network),该网络结合了局部特征增强与全局语义建模的优势,旨在提升露天矿道路分割的准确性与鲁棒性。
露天矿道路网络的分割不仅需要识别道路的边界,还需准确区分不同类型的道路,包括主路、临时路以及废弃路。这三类道路在形态、纹理和分布上存在显著差异,给分割任务带来了额外的复杂性。例如,主路通常较为宽阔且结构清晰,而临时路可能因频繁的使用和维护而出现不规则变化,废弃路则可能因长期未使用而被沙尘覆盖或部分坍塌,导致其特征与周围环境难以区分。因此,传统的道路分割方法在处理这些复杂场景时往往表现不佳,特别是在面对模糊边界、弱纹理区域和多重干扰因素时,分割结果容易出现误判或遗漏。
近年来,随着深度学习技术的迅速发展,图像分割领域取得了显著进展。特别是在语义分割任务中,基于卷积神经网络(CNN)的端到端训练方法被广泛采用,使得模型能够自动学习图像中的语义特征,从而有效缓解了传统方法依赖人工特征工程的局限性。其中,U-Net因其独特的编码器-解码器结构和跳跃连接机制,成为图像分割任务中的经典模型。U-Net通过多层次的特征提取和融合,能够在复杂背景中保持较高的分割精度。然而,在露天矿道路分割的应用中,U-Net仍然面临一定的挑战,尤其是在处理具有模糊边界和复杂纹理的场景时,其性能受到一定限制。
为克服U-Net在露天矿道路分割中的不足,研究者们提出了多种改进方法。例如,通过引入残差网络(ResNet)模块和注意力机制,可以增强模型对复杂边界和弱纹理区域的识别能力。此外,多尺度特征融合策略也被广泛应用,以提升模型对沙尘和噪声干扰的鲁棒性。这些方法在一定程度上提高了道路分割的精度,但在处理长距离的空间依赖关系和多源干扰因素时,仍存在一定的局限性。
针对上述问题,本文提出的MRS-Net在设计上进行了多项创新。首先,构建了一个ResNetV2与Transformer相结合的级联编码器,利用残差连接保留亚像素级别的边缘细节,并通过多头自注意力机制建立长距离的空间依赖关系,从而增强对弱纹理区域的表示能力。其次,设计了一个道路多尺度特征融合模块(RMFF),该模块通过逐步的空洞卷积提取局部几何特征和全局连续性特征,使得模型能够有效融合多尺度特征信息,并抑制沙尘对分割结果的干扰。最后,采用了一个逐步解码架构,结合双线性插值方法提升边缘的平滑度,从而优化道路分割的整体效果。
在实际应用中,MRS-Net被用于中国辽宁省鞍山露天铁矿的无人机(UAV)采集道路数据集上进行测试。测试结果表明,MRS-Net在主路、临时路和废弃路三种场景下的分割性能均优于DeepLabV3+和TransUNet等经典模型。具体而言,MRS-Net在主路场景下取得了89.4%的IoU、94.1%的Dice系数和87.2%的Kappa系数;在临时路场景下取得了75.7%的IoU、83.3%的Dice系数和75.1%的Kappa系数;在废弃路场景下取得了83.8%的IoU、90.0%的Dice系数和84.85%的Kappa系数。这些结果充分证明了MRS-Net在露天矿道路分割任务中的优越性。
此外,本文还对MRS-Net的性能进行了深入分析。在模型的编码器部分,通过将ResNetV2与Transformer相结合,不仅提升了模型对局部细节和全局依赖关系的捕捉能力,还增强了对复杂背景和模糊边界的适应性。在解码器部分,逐步解码架构结合双线性插值方法,使得模型能够在恢复空间维度的同时,保持边缘的平滑性和连续性。这些设计在提升分割精度的同时,也显著提高了模型的鲁棒性,使其能够在多源干扰和复杂环境条件下稳定运行。
为了进一步验证MRS-Net的有效性,本文还对比了其他先进的道路分割方法。例如,基于Transformer的模型如TransUNet在处理长距离依赖关系和全局上下文信息方面表现出色,但在处理局部细节和复杂纹理时可能存在不足。而基于ResNet的模型如DeepLabV3+在局部特征提取方面具有优势,但在全局依赖建模和多尺度特征融合方面表现有限。相比之下,MRS-Net通过结合ResNetV2和Transformer的优势,不仅在局部细节和全局语义建模方面取得了良好的平衡,还在多尺度特征融合和长距离依赖建模方面实现了突破。
在实际应用中,MRS-Net不仅能够提高道路分割的精度,还能够增强对不同道路类型的识别能力。例如,在主路分割中,MRS-Net能够准确识别宽阔且结构清晰的道路,而在临时路和废弃路的分割中,该模型能够有效区分具有相似形态和纹理的道路,并保持较高的分割质量。这种能力对于露天矿的智能化管理具有重要意义,能够为矿区的数字孪生系统、自主路径规划以及三维实景建模提供高质量的道路数据支持。
此外,MRS-Net的提出也为未来的研究提供了新的思路。通过将Transformer的全局自注意力机制与ResNet的局部特征提取能力相结合,MRS-Net不仅提升了道路分割的精度,还增强了模型对复杂环境的适应性。这种混合架构的设计在其他类似的图像分割任务中也具有广泛的适用性,例如在遥感图像处理、自动驾驶场景理解以及变形监测等领域。因此,MRS-Net不仅在露天矿道路分割任务中表现出色,也为其他复杂场景下的图像分割提供了新的解决方案。
在模型的实际部署中,MRS-Net需要依赖一定的硬件和软件支持。例如,该模型在NVIDIA RTX 3060 Ti硬件平台上运行,能够充分发挥其计算能力。同时,MRS-Net的代码基于Python和PyTorch编写,能够在PyCharm和Labelme等开发环境中进行运行和调试。这些技术细节确保了MRS-Net的可扩展性和实用性,使其能够在不同的应用场景中稳定运行。
综上所述,MRS-Net通过结合ResNetV2和Transformer的优势,有效解决了露天矿道路分割中的关键问题。其在局部细节提取、全局语义建模和多尺度特征融合方面的创新设计,使得模型在复杂背景和干扰因素下仍能保持较高的分割精度和鲁棒性。同时,MRS-Net在不同道路类型下的表现也表明了其在实际应用中的广泛适用性。未来,随着深度学习技术的不断发展,MRS-Net有望在更多复杂的图像分割任务中发挥重要作用,为智能矿山和自动驾驶技术的发展提供有力支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号