波浪破碎是近岸区域最基本的过程之一,因为它产生了大量的能量耗散,在海岸水动力学和形态动力学中起着关键作用(Castelle等人,2022年)。根据Holman和Haller(2013年)的研究,测量波浪破碎的能量耗散本质上等同于测量波浪驱动力,尤其是在波浪破碎开始时的快速过渡区域之外。因此,识别波浪破碎事件的时空发生位置和几何形状以及量化其相关的能量耗散对于估算波浪设置(Stephens等人,2011年;Flores等人,2016年)和平均流速(Díaz等人,2018年)至关重要,同时也有助于校准数值模型(Moris等人,2021年;Szczyrba等人,2023年)或改进测深反演(Oades等人,2023年)。
在波浪破碎区域内,波浪滚动的存在被认为是波浪破碎的一个良好代理指标(Svendsen,1984年;Martins等人,2018年;Moris等人,2021年)。尽管肉眼容易观察到波浪滚动的现象,但测量其时空演变仍然是一个具有挑战性的任务。在当前的术语中,这个过程被称为分割,即将视野内的特征识别为不同的元素。遥感是一种有价值的工具,可以量化其发生和几何参数,提供高空间和时间分辨率,涵盖各种电磁范围,如光学、红外或微波(Holman和Haller,2013年)。然而,传统方法使用波浪滚动部分与非破碎表面之间的高强度对比度(或信噪比)作为区分破碎表面和非破碎表面的主要依据。这种方法被证明是不可靠的,因为非破碎表面也是高强度信号的来源,这阻碍了准确的分割。例如,残留的泡沫也具有较大的光学强度值,使得区分变得困难,可能需要启发式方法来进行分割(Aarninkhof和Ruessink,2004年)。在微波范围内,波浪的陡峭程度会导致较大的后向散射,使得传统的分割变得困难(Catalán等人,2011年;Catalán等人,2014年;Szczyrba等人,2023年;St?le-Hentschel等人,2024年),尽管(Stre?er等人,2022年)使用X波段的多普勒雷达获得了良好的结果。红外范围似乎更适合独立分割(Carini等人,2015年)。然而,多普勒雷达和红外相机的普及程度不如光学范围内的传感器。此外,光学和微波传感器的融合在识别和跟踪单个波浪破碎事件及其平面几何形状(方向、沿波和横波范围,因此是在水平平面上的投影面积)方面表现出了可靠的性能,这允许直接估算波浪破碎的耗散(Díaz等人,2018年)。同样,红外和LiDAR的融合也被用于增强估算波浪参数,这些参数对于估算波浪破碎耗散至关重要(Carini等人,2021年)。然而,融合依赖于多传感器设置和校准,成本较高,可能难以部署,并且对环境和波浪条件敏感。值得注意的是,一些沿海应用可能不需要精确区分破碎波和非破碎波,因为其他量也很重要,例如用于测深反演的波浪相位(Holman和Bergsma,2021年)、波浪角度(Szczyrba等人,2023年)或破碎波的比例(Oades等人,2023年;Moris等人,2021年),尽管它们可以从逐波数据中受益。
在多样的沿海环境中保持一致的分割性能仍然是一个重大挑战,但另一方面,光学图像的普及性使得在这一领域继续努力成为必要。深度学习技术,特别是卷积神经网络(CNN),在包括成像和分割任务在内的沿海研究中变得越来越突出。Buscombe和Carini(2019年)评估了各种CNN架构,使用红外图像对破碎波类型(溢出波和倾泻波)进行分类,而Buscombe等人(2020年)开发了一个网络,从光学图像预测波高和波周期时间序列。Stringari等人(2021年)提出了一个CNN,用于从光学图像检测深水区受陡度限制的破碎波的覆盖范围,而(Stringari和Power,2019年)从光学数据估计了冲浪区的破碎波比例。这些实现中的大多数没有明确估计近岸波浪破碎的关键属性,例如平面几何形状,这对于量化波浪破碎区的能量耗散至关重要(Haller和Catalán,2009年),例如采用了Duncan(1981年)和Svendsen(1984年)的模型。为了解决这个问题,Sáez等人(2021年)引入了一种基于CNN的方法,实现了U-Net架构(Ronneberger等人,2015年)。该方法使用单个电光图像(即照片)作为输入,以分割其中的每个破碎波,从而获得其平面几何形状。这些快照来自美国北卡罗来纳州Duck的ARGUS系统的海岸监测相机拍摄的一系列视频记录(Holman和Stanley,2007年)。他们的网络架构使用Catalán等人(2011年)的传感器融合方法获得的数据进行了训练,并应用于同一相机的其他数据集,取得了非常好的结果。
理想情况下,可以在不同条件下使用现有的深度学习模型。然而,这很少能产生良好的结果。一个显而易见的解决方案是重新训练模型,但这需要大量的精心策划的数据进行训练和验证。这使得问题有些循环,因为缺乏波浪破碎数据正是需要解决的问题,而没有其他技术能够轻松提供这些数据。在现实世界的应用中,通过遥感收集未标记的数据相对直接且成本效益高,但手动注释和分割既费力又昂贵。这种不平衡导致未标记数据的数量远多于可用的标记数据,限制了模型的适用性和泛化能力(Buscombe等人,2022年;Ma等人,2024年)。
为了解决这种泛化不足的问题,存在不同的方法。迁移学习(Transfer Learning, TL)技术,如微调,旨在使机器学习模型能够将从前一个任务或条件下学到的知识转移到新环境中(Zhuang等人,2021年)。TL方法可以应用于预训练的模型,例如Sáez等人(2021年)的U-Net架构,以便在受控条件下将一个领域中获得的知识应用于新环境,从而在最小化大量手动标记需求的同时提高模型性能。
另一种选择是在模型开发过程中包括人类反馈。这种技术称为人在循环中(Human-in-the-Loop, HITL),允许专家监督模型预测、纠正错误并在训练过程中提供实时反馈,从而提供相当于即时注释的效果(Buscombe等人,2022年)。通过将专家知识整合到学习周期中,HITL有助于模型适应特定的目标领域。TL和HITL策略的结合提供了一个实用且有效的框架,使模型能够在目标领域有效运行。它利用大量的未标记数据来适应特定或具有挑战性的任务(Mosqueira-Rey等人,2023年),从而即使在标记数据稀缺的情况下也能提高模型的鲁棒性和准确性(Zhuang等人,2021年;Ma等人,2024年)。
基于这些基础,提出了一种称为波浪破碎检测器(Wave Breaking Detector, WBD)的通用方法,用于在近岸电光图像中检测波浪破碎滚动的现象(作为波浪破碎的代理),不仅提取它们的发生位置,还提取它们的平面几何形状和时空演变。WBD旨在作为一个稳健的观测工具,而不是替代基于物理的波浪破碎公式。WBD使用有限的初始标签和迭代的专家反馈,将先前训练的U-Net模型适应于多样的沿海环境。该方法在三个地理位置不同的地点进行了测试:美国北卡罗来纳州的Duck;智利圣安东尼奥的Maipo河口;以及法国Palavas-les-Flots的Saint-Pierre海滩。此外,还包括了不同熟练程度的用户,以评估在尝试泛化波浪破碎分割时的重要性。
本文的结构如下:第2节提供了迁移学习和人在循环中技术的概述,用于分割问题。第3节详细介绍了数据策划、算法配置以及训练和验证方法。第4节和第5节分别展示了实验结果和讨论。