基于多模态数据融合的水下声智能频谱感知:Mul-YOLO 方法

【字体: 时间:2025年05月20日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  为解决复杂动态海洋环境下水声频谱利用率低的问题,研究人员开展基于多模态数据融合的智能频谱感知研究,提出 Mul-YOLO 网络。结果显示其检测概率提升 5.9%-18.9%,虚警概率优化 7%-12.7%,为 OIOT 频谱资源管理提供新方案。

  
在浩瀚的海洋中,海洋物联网(OIOT)正成为未来全球海洋研发的核心技术,它如同海洋的 “神经网络”,将海底设备、船舶、潜艇等连接起来,实现环境监测、资源勘探等复杂任务。然而,这一 “神经网络” 的高效运行面临着严峻挑战:水下声通信频谱资源极为有限,多径衰落、噪声干扰等问题导致频谱利用率低下,传统固定频谱分配模式难以应对动态变化的海洋环境。如何在这片 “频谱海洋” 中精准找到空闲频段(频谱空洞),避免用户间干扰,成为 OIOT 发展的关键瓶颈。

为突破这一困境,国内研究人员开展了水下声智能频谱感知技术研究,相关成果发表在《Future Generation Computer Systems》。该团队致力于解决复杂海洋环境下的频谱感知难题,通过融合多模态数据与改进 YOLO 网络,为水下频谱资源的高效利用提供了新路径。

研究采用的关键技术包括:

  1. 多模态数据构建:将水下声信号的时间序列数据通过小波变换(CWT)转化为图像数据,形成包含时空信息的多模态数据集;利用去噪自编码器(DAE)对时间序列数据进行无监督降噪,提升数据质量。
  2. Mul-YOLO 网络架构:设计并行双主干 YOLO 网络,一支路通过深度可分离卷积(DSC)捕捉关键时间特征,另一支路采用改进 CSPDarknet 提取空间特征;引入模态交互模块与坐标注意力(CA)机制,促进跨模态特征融合与多尺度信息感知。

性能评估与结果


在硬件配置为 [见表 1] 的环境下,采用 Adam 优化器(学习率 0.00001,批量大小 32)训练网络。数据集包含 1966 组时间序列与图像样本(训练 / 验证 / 测试集按 8:1:1 划分),通过以下实验验证性能:

  • 检测概率提升:在信噪比 - 12 dB 至 0 dB 范围内,与 CNN、ResNet、YOLOv5 等算法相比,Mul-YOLO 的平均检测概率提高 5.9%-18.9%,显著提升了低信噪比环境下的频谱空洞识别能力。
  • 虚警概率优化:平均虚警概率降低 7%-12.7%,有效减少了误判干扰,保障了频谱分配的可靠性。

结论与意义


该研究构建的多模态数据集与 Mul-YOLO 模型,通过融合时空特征与跨模态交互机制,突破了传统单模态数据与卷积神经网络的局限性,为水下认知声网络(UCANs)提供了高精度频谱感知方案。实验表明,该方法能有效提升复杂海洋环境下的频谱利用率,避免用户间干扰,对推动 OIOT 在海洋勘探、国防安全等领域的应用具有重要意义。未来,多模态融合与轻量化网络设计或成为水下智能通信的重要发展方向,助力实现 “智能海洋” 的战略目标。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号