
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DSM-Net:面向深海采矿车的多尺度声呐图像检测网络
【字体: 大 中 小 】 时间:2025年04月22日 来源:Applied Ocean Research 4.3
编辑推荐:
为解决深海采矿车(DSMV)在复杂海底地形中实时多尺度障碍物检测的难题,研究人员开发了基于YOLOv8改进的DSM-Net网络。该研究创新性地提出Tri-Scale Attention(TSA)模块和Partial-Dynamic Module(PDM),结合ASFF*检测头和Adaptive Difficulty Loss(ADL)函数,在DSMSD数据集上实现mAP@0.5:0.95提升2.16%,推理时间降低18.75%,为深海采矿安全作业提供了高效解决方案。
深海采矿是解决陆地资源短缺的重要战略,但复杂海底环境中的多尺度障碍物(如大型岩石、沟壑和小型碎石)严重威胁采矿车(DSMV)的安全运行。传统光学摄像头受沉积物羽流干扰严重,而声呐图像虽能穿透浑浊水域,却面临分辨率低、噪声高和多尺度目标检测的挑战。现有方法难以在检测精度和实时性之间取得平衡,亟需开发适应深海复杂环境的专用检测算法。
针对这一难题,上海交通大学等机构的研究人员开发了DSM-Net多尺度地形检测网络。该研究以YOLOv8为基线模型,通过三个关键技术突破实现了性能提升:首先采用Partial-Dynamic Module(PDM)模块,通过动态配置1×1至3×3卷积核和部分卷积(P-Conv)分支,在减少29.4%推理时间的同时提升特征利用率;其次设计Tri-Scale Attention(TSA)混合注意力模块,整合全局平均池化(GAP)、局部平均池化(LAP)和多尺度分支,使小岩石检测准确率提升3.1%;最后引入ASFF*检测头增加160×160分辨率的小目标检测层,并开发Adaptive Difficulty Loss(ADL)损失函数,通过分段加权策略有效解决样本难度不平衡问题。研究使用包含2867张声呐图像的DSMSD数据集(源自"Pioneer I/II"采矿车和池试验),在Ubuntu 20.04系统搭配RTX 4090D的硬件环境下进行验证。
高效特征提取与融合模块(PDM)
PDM模块通过双分支结构实现:D-Conv分支动态选择卷积核尺寸,P-Conv分支仅处理部分通道减少计算量。实验表明,相比ACmix和BiFPN等模块,PDM以6.7 GFLOPs的计算量实现83.63%的mAP@0.5,推理时间仅1.2ms。
TSA模块:多级特征融合与噪声抑制策略
TSA模块通过三分支结构处理不同尺度特征,其中全局分支抑制背景噪声,局部分支增强小目标特征。热力图对比显示,TSA使网络更聚焦目标密集区域,将大岩石检测准确率提升至92.2%,优于CBAM等传统注意力机制。
改进的自适应特征融合检测头
新增的P2检测层显著提升小岩石(mAP@0.5达86.2%)和中等岩石(65.9%)的识别率。ASFF*通过权重学习实现四级特征图(160×160至20×20)的自适应融合,较原YOLOv8检测头提升3.1%的小目标检测精度。
自适应难度损失(ADL)
ADL根据IoU值将样本分为易/边界/难三类,采用指数衰减加权策略。在DSM-Net中应用后,边界样本(IoU在μ-0.2至μ范围)权重提升至e1-μ,使中等岩石检测mAP@0.5提高1.2%,推理时间缩短7.14%。
综合性能验证
在DSMSD测试集上,完整DSM-Net实现85.76%的mAP@0.5和46.67%的mAP@0.5:0.95,参数仅6.23M。与主流模型对比显示:较YOLOv10精度提高0.92%且参数更少;相比Transformer架构的RT-DETR,推理速度快7.1%;较专用声呐检测网络RMFENet,mAP@0.5:0.95提升1.48%。海试验证表明,该网络能准确识别图16-18中各类岩石地形,为采矿车路径规划提供可靠感知输入。
该研究通过模块化创新解决了深海声呐图像检测的核心难题:PDM平衡了计算效率与特征表达能力,TSA有效抑制噪声并增强多尺度特征,ADL则优化了复杂样本的学习过程。DSM-Net在保持实时性的前提下,显著提升了对关键障碍物的检测精度,其工程价值已在"Pioneer"系列采矿车的实际作业中得到验证。未来通过扩充更多复杂地形数据和融合三维点云技术,可进一步推动深海采矿的智能化发展。
生物通微信公众号
知名企业招聘