复杂海洋环境下的红外舰船检测:基于YOLOv12的鲁棒性与基准评估

《Journal of Ocean Engineering and Science》:Infrared Ship Detection in Challenging Maritime Environments: A YOLOv12-Based Robustness and Benchmark Evaluation

【字体: 时间:2026年06月09日 来源:Journal of Ocean Engineering and Science 11.8

编辑推荐:

  红外成像在海事监视中发挥着重要作用,尤其适用于低照度、夜间以及海面视觉退化条件。 然而,红外图像中的舰船检测仍然面临挑战,原因在于目标轮廓模糊、热特征(thermal signatures)较弱、海洋背景动态变化显著,以及目标尺度差异较大。为应对这些实际困难,

  
红外成像在海事监视中发挥着重要作用,尤其适用于低照度、夜间以及海面视觉退化条件。 然而,红外图像中的舰船检测仍然面临挑战,原因在于目标轮廓模糊、热特征(thermal signatures)较弱、海洋背景动态变化显著,以及目标尺度差异较大。为应对这些实际困难,本研究构建了一种面向复杂海洋环境的基于YOLOv12的红外舰船检测框架,并建立了一个任务导向型红外海事数据集,涵盖7类具有代表性的舰船类别及多样化场景,包括夜间作业、海面反射、局部遮挡和动态波浪干扰。该数据集由公开可用的红外海事图像资源重组而来,并通过人工标注、校验、预处理和数据增强进一步完善。为提升鲁棒性和泛化能力,研究人员在训练过程中采用了几何增强、类别重平衡和迭代式标签修正。研究在统一训练协议下开展了大量实验,以评估YOLOv12系列在红外海事舰船检测中的适用性。最终模型取得了0.9174的精确率、0.8889的召回率、0.9029的F1值、0.9276的mAP50以及0.8013的mAP50-95,同时Box_loss、Cls_loss和Dfl_loss的收敛行为验证了优化过程的稳定性。除标准定量评估外,研究还进一步考察了模型在远距离小目标检测、多目标分类、动态海洋场景以及不同检测范式比较分析中的应用表现。此外,研究还针对夜间红外舰船检测进行了基于距离的注意力热图分析,以为模型行为提供可解释性支持。结果表明,所提出的基于YOLOv12的流程为复杂海洋环境下的红外舰船检测提供了一种可靠且具有实用价值的解决方案,并在未来智能海事监测系统部署中展现出良好潜力。
该文发表于《Journal of Ocean Engineering and Science》,围绕复杂海洋环境中的红外舰船检测问题展开系统研究。研究背景在于,随着全球海洋资源开发和海上运输快速发展,海事安防、航道监管、非法船只活动识别等场景对智能化、自动化海洋监测技术提出了更高要求。舰船目标检测作为智能海洋感知系统的核心环节,在港口安保、海上搜救、非法捕捞监测和远程执法等任务中具有关键意义。与可见光成像相比,红外成像具备全天候、昼夜连续工作以及较强低能见度穿透能力,因此特别适用于夜间、雾天和远距离观测。但红外图像也存在天然缺陷,如纹理模糊、对比度低、目标与背景热差异有限、信噪比(SNR,信号与噪声之比)偏低,以及海面反射和动态波浪带来的复杂干扰,这些因素导致小目标、远距离目标和局部遮挡目标的检测难度显著增加。已有基于Faster R-CNN、YOLOv5、RetinaNet等主流检测器的研究虽已应用于红外场景,但在复杂海洋背景下的实时性、鲁棒性和低显著性目标建模能力仍有限。因此,开展面向红外海事场景、兼顾多尺度感知与深层语义建模的专门研究具有明确必要性。

研究人员围绕这一问题,采用YOLOv12作为基础检测器,在不修改其原始骨干网络(backbone)、颈部网络(neck)和检测头(head)结构的前提下,构建了一套面向复杂海洋环境的红外舰船检测评估框架。研究的一个重要基础工作是构建任务导向型数据集。该数据集并非独立外场采集,而是基于两个已发表的红外舰船图像资源重组而成,经过类别统一、标注核验、YOLO格式标准化、预处理和增强后,形成适用于多类别红外海事检测的数据基础。数据集共包含8002幅红外图像,划分为训练集5601幅、验证集2000幅和测试集401幅,覆盖liner、bulk carrier、warship、sailboat、canoe、container ship和fishing boat共7类船舶,场景涉及昼夜变化、海面反射、雾霾、动态波浪扰动、局部遮挡以及远距离成像等复杂环境。围绕这一数据基础,研究人员系统完成了模型训练、损失函数分析、精度指标评估、PR曲线分析、测试集可视化检验、与其他检测器的混淆矩阵比较,以及小目标、多目标、动态场景和夜间基于距离的注意力热图分析。研究最终得出结论:YOLOv12在复杂海洋红外舰船检测中表现出较高检测精度、较稳定优化过程、较好的多场景适应性和较强工程应用潜力,说明现代轻量级实时检测器在红外海事感知领域具备良好适用性。其重要意义在于同时提供了一个较为规范的任务型红外海事数据集,以及一套系统化的YOLOv12红外海事适用性实证证据,为后续红外舰船感知研究和智能海事监测系统发展奠定了基础。

作者开展研究所采用的主要技术方法可概括如下:其一,基于公开红外舰船图像资源构建七分类任务导向型数据集,并使用Labelme完成标注后转换为YOLO标签格式,同时进行人工核验、预处理、几何增强和类别重采样;其二,在统一硬件与软件环境下,使用预训练YOLOv12x.pt进行迁移学习(transfer learning),采用AdamW优化器、余弦退火学习率调度、自动混合精度和L2正则化完成训练;其三,通过Box_loss、Cls_loss、Dfl_loss及Precision、Recall、F1、mAP50、mAP50-95等指标,对模型进行定量评估,并结合PR曲线、混淆矩阵、场景化测试和夜间距离注意力热图开展行为分析。样本来源为两套已发表红外舰船图像资源,而非独立新采集队列。

在研究结果部分,论文首先在“5.1. Evaluation and Analysis Based on Loss Functions”中分析了损失函数表现。研究表明,Box_loss、Cls_loss和Dfl_loss三类损失均表现出清晰收敛与较好稳定性。Cls_loss下降最快,说明模型较早建立了舰船类别间的判别边界;Box_loss持续下降,表明在适应模糊边界、遮挡和低对比度轮廓后,模型的定位一致性不断改善;Dfl_loss下降较慢但过程平稳,说明其主要在训练后期进一步细化边界回归。整体上,三种损失函数共同证明了YOLOv12在红外海事场景中的优化过程稳定,能够在分类、定位与边界精修之间实现平衡。

在“5.2. Evaluation Using Accuracy Metrics”中,研究通过精确率、召回率、F1值、mAP50和mAP50-95对检测性能进行量化。结果显示,模型最终达到Precision 0.9174、Recall 0.8889、F1 0.9029、mAP50 0.9276和mAP50-95 0.8013。精确率的持续提升说明模型逐渐抑制了海面反射和背景热杂波引发的误检;召回率显著提高说明模型对小尺度、低对比度舰船的敏感性逐步增强;mAP50快速上升并稳定在高水平,说明在IoU=0.5阈值下具有较强总体检测能力;mAP50-95持续改善则表明模型在多尺度目标和更严格定位要求下仍具备较高鲁棒性。

在“5.3. PR Curve-Based Evaluation and Analysis”中,研究通过PR曲线评估不同类别的检测行为。warship、container ship和canoe的PR曲线最接近右上角,对应mAP50分别为0.991、0.972和0.970,说明这些类别在红外图像中轮廓或热特征相对稳定,模型更易识别。liner和sailboat表现也较好,而fishing boat和bulk carrier相对较弱,主要与边界模糊、结构相似及尺度变化大有关。总体宏平均PR曲线对应mAP50为0.927,证明模型在七类别任务上具有较强分类一致性和泛化能力。

在“5.4. Evaluation and Analysis of Test Set Results”中,研究展示了测试集中7类舰船的代表性检测结果。各类别目标在多种环境下均能以较高置信度被成功识别,边界框定位较准确,说明模型在静水、近岸复杂背景、中远距离观测、局部遮挡及多尺度成像条件下具有较强识别与泛化能力。尤其是对warship、container ship和liner等目标,模型展现出稳定的热特征捕捉能力;对canoe和fishing boat等低显著性或复杂背景目标,也显示出一定可靠性。

在“5.5. Comparative Evaluation with Existing Models”中,作者将本研究与近年来若干YOLO系红外舰船检测研究进行文献层面对比。论文强调,由于数据集、训练协议和评价设置并不统一,这一比较仅用于提供背景语境,而非严格基准测试。即便如此,结果仍显示,YOLOv12依托A2C2f注意力机制和C3K2层级多尺度特征融合,在精度、鲁棒性和计算效率之间取得较优平衡,特别适合复杂海洋红外检测场景。

在“6.1. Small-Object Detection Performance in Long-Range Scenarios”中,研究关注远距离小目标检测。结果表明,当目标仅占图像面积的1%~5%时,YOLOv12仍能较稳定识别liner、warship、bulk carrier、container ship和canoe等类别,说明模型对远距离弱热目标仍保有一定判别能力。不过论文也明确指出,极端小尺寸、低对比度和边界极不清晰的目标仍然构成挑战。

在“6.2. Detection Accuracy and Classification Capability in Multitarget Scenarios”中,研究人员考察了多目标密集场景。结果显示,当多种船舶类别近距离共存、局部遮挡或远近混杂时,模型多数情况下能够完成正确分类与合理定位,说明其在高密度海事场景中具有较好的类别区分能力与空间分离能力。但在极端高密度条件下,仍会出现少量边框重叠和目标分离不充分现象。

在“6.3. Detection Stability in Dynamic Maritime Scenarios”中,论文分析了动态海洋序列中的检测稳定性。结果表明,在连续帧中面对目标移动、姿态变化和视角变化时,YOLOv12对sailboat、warship、container ship和fishing boat等目标保持了较稳定分类与定位,边界框抖动较小,未见明显类别漂移或空间漂移。在输入分辨率1280 × 1280下,实验观察到约20~24 FPS的推理速度,说明其具备一定部署可行性,但论文同时强调这不等同于平台级部署验证。

在“6.4. Comparative Confusion Matrix Analysis of Different Detectors in Challenging Infrared Maritime Environments”中,研究比较了YOLOv12、YOLOv11、YOLOv10、YOLOv8、YOLOv5和RT-DETR在相同红外海事条件下的混淆矩阵。结果显示,YOLOv12的对角线分布更集中,且在若干高风险背景到前景误报路径上,误报数低于RT-DETR,说明其背景抑制相对稳定。作者将这一现象与YOLOv12原生的区域注意力(Area Attention)和多尺度特征聚合能力联系起来,认为这些机制有助于抑制由模糊边界、尺度变化和热背景干扰造成的类别混淆。

在“7. Discussion”部分,论文重点讨论了模型局限与未来发展方向。首先,在“7.1. Detection Challenges and Limitations”中,作者通过失败案例指出,模型在复杂海洋红外场景下仍存在漏检、误分类和重复检测问题。漏检主要发生在极小目标、弱热目标和近岸复杂热背景中;误分类与红外结构细节缺失、类别不平衡及共享骨干特征提取有关;重复检测则与多尺度特征层重复激活及类别无关NMS有关。这些问题揭示出模型在多尺度语义表达、类别特征解耦和预测融合策略上仍有改进空间。随后,论文指出当前数据中缺乏严酷天气和热交叉干扰场景,因此尚未对重雾、降雨、密集水汽和多船热辐射重叠等情况开展实证验证。作者认为,这些极端条件可能进一步削弱热对比度、扩大背景噪声并加重目标边界混叠,是后续数据扩展和部署验证的重要方向。

在“7.2. Distance-Based Attention Heatmap Analysis in Night-Time Infrared Ship Detection”中,研究利用夜间样本进行了基于距离的注意力热图分析。结果表明,近距离目标具有连续且集中于船体与上层结构的高响应区域,背景海面和天空则大多被抑制;中距离目标的注意力开始变窄并扩散,局部会蔓延至邻近海域和地平线高亮结构;远距离靠近地平线的目标仅保留点状热响应,几乎丧失结构语义信息。这说明模型对近中距离夜间红外目标的关注较为合理,但在远距离场景下,类别判别能力明显受限,进一步支持了多尺度监督和距离鲁棒注意力机制研究的必要性。

在“7.3. System Applicability and Future Research Prospects”中,作者认为YOLOv12在图像模糊、目标密集和局部遮挡等条件下仍表现出良好稳健性,因此在无人机巡检、港口监视和近岸智能预警设备等方向具备应用潜力。但文章并未宣称已完成平台级部署,只是指出后续应围绕系统时延、资源消耗、长时视频流稳定性及专用海事硬件上的鲁棒性开展进一步评估。未来研究方向包括:增强全局上下文建模能力、改善类别不平衡和稀缺类别学习、推进红外与可见光/SAR的多模态融合、解决跨模态空间失配与语义不一致问题,并扩充极端海洋环境下的数据覆盖范围。

论文结论部分可翻译为:本研究提出了一种面向复杂海洋条件下红外舰船检测的基于YOLOv12的评估框架。基于从已发表红外舰船图像资源整理得到的任务导向型数据集,研究在一致的实验设置下完成了标注标准化、模型训练与评估,并分析了模型在小目标、多目标、动态以及杂波干扰红外海事场景中的行为。结果表明,在所测试条件下,YOLOv12能够实现稳定的检测性能。然而,本研究并未宣称完成实际平台级部署测试。当前仍存在的局限包括对弱热目标的漏检、模糊边界条件下的类别混淆,以及缺乏专用海事硬件验证。未来工作将聚焦于扩展极端海洋条件下的数据覆盖、提升对弱热目标和模糊边界的鲁棒性、融合可见光/SAR/红外多模态信息,并在专用海事监测硬件上评估模型性能。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号