一种基于迁移学习和人机交互的通用方法，用于逐波识别近岸波浪破碎模式

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Coastal Engineering》：A generalized method based on transfer learning and human-in-the-loop for wave-by-wave identification of nearshore wave breaking patterns

【字体：大中小】 时间：2026年02月09日 来源：Coastal Engineering 4.5

编辑推荐：

　　提出基于迁移学习和人机协同的通用机器学习方法，用于检测近岸波浪破碎事件，解决了传统方法在复杂环境中的不足。通过三个不同地点（美国杜克、智利马皮河、法国圣皮埃尔海滩）和不同用户群体的测试，模型准确率达80%-90%，验证了其鲁棒性，并开源供社区应用。

灾害风险、韧性和恢复跨学科研究中心（CIGIDEN R+），CIN250023，智利圣地亚哥

摘要

波浪破碎是近岸区域的一个基本过程。然而，由于其混沌性质，自动识别每个波浪的时空发生位置仍然是一个挑战。为了解决这个问题，提出了一种基于机器学习的通用方法，用于在广泛的环境和水动力条件下检测波浪破碎事件。该方法基于先前使用Duck（美国）数据训练的U-Net架构，并通过迁移学习（Transfer Learning, TL）和人在循环中（Human-in-the-Loop, HITL）技术进行扩展，使得模型能够在少量标记数据的情况下有效适应新的沿海地点和条件。该方法在三个不同的地点进行了测试：美国北卡罗来纳州的Duck；智利圣安东尼奥的Maipo河口；以及法国Palavas-les-Flots的Saint-Pierre海滩。此外，还考虑了三种不同熟练程度的用户，以评估采用该方法的难易程度。根据地点的不同，模型在波浪破碎识别方面的准确率在80%到90%之间，定性评估确认即使在光照变化和波浪-结构相互作用等具有挑战性的条件下，该方法也能表现出稳健的性能。开源实现旨在促进社区使用和适应。因此，准确识别波浪破碎模式有望成为推进我们对近岸过程理解的宝贵工具。

引言

波浪破碎是近岸区域最基本的过程之一，因为它产生了大量的能量耗散，在海岸水动力学和形态动力学中起着关键作用（Castelle等人，2022年）。根据Holman和Haller（2013年）的研究，测量波浪破碎的能量耗散本质上等同于测量波浪驱动力，尤其是在波浪破碎开始时的快速过渡区域之外。因此，识别波浪破碎事件的时空发生位置和几何形状以及量化其相关的能量耗散对于估算波浪设置（Stephens等人，2011年；Flores等人，2016年）和平均流速（Díaz等人，2018年）至关重要，同时也有助于校准数值模型（Moris等人，2021年；Szczyrba等人，2023年）或改进测深反演（Oades等人，2023年）。

在波浪破碎区域内，波浪滚动的存在被认为是波浪破碎的一个良好代理指标（Svendsen，1984年；Martins等人，2018年；Moris等人，2021年）。尽管肉眼容易观察到波浪滚动的现象，但测量其时空演变仍然是一个具有挑战性的任务。在当前的术语中，这个过程被称为分割，即将视野内的特征识别为不同的元素。遥感是一种有价值的工具，可以量化其发生和几何参数，提供高空间和时间分辨率，涵盖各种电磁范围，如光学、红外或微波（Holman和Haller，2013年）。然而，传统方法使用波浪滚动部分与非破碎表面之间的高强度对比度（或信噪比）作为区分破碎表面和非破碎表面的主要依据。这种方法被证明是不可靠的，因为非破碎表面也是高强度信号的来源，这阻碍了准确的分割。例如，残留的泡沫也具有较大的光学强度值，使得区分变得困难，可能需要启发式方法来进行分割（Aarninkhof和Ruessink，2004年）。在微波范围内，波浪的陡峭程度会导致较大的后向散射，使得传统的分割变得困难（Catalán等人，2011年；Catalán等人，2014年；Szczyrba等人，2023年；St?le-Hentschel等人，2024年），尽管（Stre?er等人，2022年）使用X波段的多普勒雷达获得了良好的结果。红外范围似乎更适合独立分割（Carini等人，2015年）。然而，多普勒雷达和红外相机的普及程度不如光学范围内的传感器。此外，光学和微波传感器的融合在识别和跟踪单个波浪破碎事件及其平面几何形状（方向、沿波和横波范围，因此是在水平平面上的投影面积）方面表现出了可靠的性能，这允许直接估算波浪破碎的耗散（Díaz等人，2018年）。同样，红外和LiDAR的融合也被用于增强估算波浪参数，这些参数对于估算波浪破碎耗散至关重要（Carini等人，2021年）。然而，融合依赖于多传感器设置和校准，成本较高，可能难以部署，并且对环境和波浪条件敏感。值得注意的是，一些沿海应用可能不需要精确区分破碎波和非破碎波，因为其他量也很重要，例如用于测深反演的波浪相位（Holman和Bergsma，2021年）、波浪角度（Szczyrba等人，2023年）或破碎波的比例（Oades等人，2023年；Moris等人，2021年），尽管它们可以从逐波数据中受益。

在多样的沿海环境中保持一致的分割性能仍然是一个重大挑战，但另一方面，光学图像的普及性使得在这一领域继续努力成为必要。深度学习技术，特别是卷积神经网络（CNN），在包括成像和分割任务在内的沿海研究中变得越来越突出。Buscombe和Carini（2019年）评估了各种CNN架构，使用红外图像对破碎波类型（溢出波和倾泻波）进行分类，而Buscombe等人（2020年）开发了一个网络，从光学图像预测波高和波周期时间序列。Stringari等人（2021年）提出了一个CNN，用于从光学图像检测深水区受陡度限制的破碎波的覆盖范围，而（Stringari和Power，2019年）从光学数据估计了冲浪区的破碎波比例。这些实现中的大多数没有明确估计近岸波浪破碎的关键属性，例如平面几何形状，这对于量化波浪破碎区的能量耗散至关重要（Haller和Catalán，2009年），例如采用了Duncan（1981年）和Svendsen（1984年）的模型。为了解决这个问题，Sáez等人（2021年）引入了一种基于CNN的方法，实现了U-Net架构（Ronneberger等人，2015年）。该方法使用单个电光图像（即照片）作为输入，以分割其中的每个破碎波，从而获得其平面几何形状。这些快照来自美国北卡罗来纳州Duck的ARGUS系统的海岸监测相机拍摄的一系列视频记录（Holman和Stanley，2007年）。他们的网络架构使用Catalán等人（2011年）的传感器融合方法获得的数据进行了训练，并应用于同一相机的其他数据集，取得了非常好的结果。

理想情况下，可以在不同条件下使用现有的深度学习模型。然而，这很少能产生良好的结果。一个显而易见的解决方案是重新训练模型，但这需要大量的精心策划的数据进行训练和验证。这使得问题有些循环，因为缺乏波浪破碎数据正是需要解决的问题，而没有其他技术能够轻松提供这些数据。在现实世界的应用中，通过遥感收集未标记的数据相对直接且成本效益高，但手动注释和分割既费力又昂贵。这种不平衡导致未标记数据的数量远多于可用的标记数据，限制了模型的适用性和泛化能力（Buscombe等人，2022年；Ma等人，2024年）。

为了解决这种泛化不足的问题，存在不同的方法。迁移学习（Transfer Learning, TL）技术，如微调，旨在使机器学习模型能够将从前一个任务或条件下学到的知识转移到新环境中（Zhuang等人，2021年）。TL方法可以应用于预训练的模型，例如Sáez等人（2021年）的U-Net架构，以便在受控条件下将一个领域中获得的知识应用于新环境，从而在最小化大量手动标记需求的同时提高模型性能。

另一种选择是在模型开发过程中包括人类反馈。这种技术称为人在循环中（Human-in-the-Loop, HITL），允许专家监督模型预测、纠正错误并在训练过程中提供实时反馈，从而提供相当于即时注释的效果（Buscombe等人，2022年）。通过将专家知识整合到学习周期中，HITL有助于模型适应特定的目标领域。TL和HITL策略的结合提供了一个实用且有效的框架，使模型能够在目标领域有效运行。它利用大量的未标记数据来适应特定或具有挑战性的任务（Mosqueira-Rey等人，2023年），从而即使在标记数据稀缺的情况下也能提高模型的鲁棒性和准确性（Zhuang等人，2021年；Ma等人，2024年）。

基于这些基础，提出了一种称为波浪破碎检测器（Wave Breaking Detector, WBD）的通用方法，用于在近岸电光图像中检测波浪破碎滚动的现象（作为波浪破碎的代理），不仅提取它们的发生位置，还提取它们的平面几何形状和时空演变。WBD旨在作为一个稳健的观测工具，而不是替代基于物理的波浪破碎公式。WBD使用有限的初始标签和迭代的专家反馈，将先前训练的U-Net模型适应于多样的沿海环境。该方法在三个地理位置不同的地点进行了测试：美国北卡罗来纳州的Duck；智利圣安东尼奥的Maipo河口；以及法国Palavas-les-Flots的Saint-Pierre海滩。此外，还包括了不同熟练程度的用户，以评估在尝试泛化波浪破碎分割时的重要性。

本文的结构如下：第2节提供了迁移学习和人在循环中技术的概述，用于分割问题。第3节详细介绍了数据策划、算法配置以及训练和验证方法。第4节和第5节分别展示了实验结果和讨论。

节选

分割概述

分割在遥感和环境图像分析中起着基础性作用，能够从大规模和多源图像中提取信息。它已被应用于各种地球观测任务，包括海岸线检测（Scala等人，2024年）、土地覆盖分类（Oscio等人，2023年）、沙洲测绘、长期海岸演变和海滩沉积物测绘（Buscombe等人，2022年），以及在更具体的领域中，用于识别波浪

数据策划

波浪破碎检测器设计使用电光图像，这些图像可以从固定相机系统或无人机等航空平台获取。目标是提供一个多功能工具，可以扩展应用于任何冲浪区域。可用数据的总量取决于图像质量和记录会话的时间覆盖范围，应旨在捕获多样的波浪状态以确保鲁棒性。

收集数据后，关键步骤是对图像进行预处理

来自北卡罗来纳州Duck的测试结果

Duck数据集是在2021年由美国陆军工程兵团野外研究设施（FRF）在北卡罗来纳州Duck收集的，大约在Catalán等人（2011年）首次收集数据后的11年。这里使用的FRF坐标系统遵循Sáez等人（2021年）描述的相同参考系统。该数据库包括在Nearshore Extreme事件期间于9月17日至27日捕获的七段30分钟的视频记录

讨论

我们的结果表明，迁移学习，特别是包括人在循环中（HITL），可以提供一种实用的替代方案，替代监督学习所需的广泛手动注释，这限制了冲浪区波浪破碎的半自动化检测。因此，WBD可以以最低的成本被任何用户应用。

然而，学习过程直接受到用户对什么是破碎波的解释的影响，尽管这一挑战并非本文所独有

结论

已经开发并测试了一种通用的机器学习框架，用于识别波浪破碎模式，并在多样但有限的沿海条件下进行了测试。该方法应用于三个在波浪条件和水动力设置方面有所不同的地点。此外，还考虑了不同类型和平台的相机以及具有不同经验水平的用户。通过整合迁移学习（TL）和人在循环中（HITL）策略，该方法

CRediT作者贡献声明

弗朗西斯科·J·萨埃斯（Francisco J. Sáez）：撰写——原始草稿，可视化，验证，软件，项目管理，方法论，形式分析，数据策划，概念化。帕特里西奥·A·卡塔兰（Patricio A. Catalán）：撰写——原始草稿，可视化，监督，项目管理，方法论，资金获取，数据策划，概念化。卡洛斯·瓦列（Carlos Valle）：撰写——审阅与编辑，验证，软件，方法论，形式分析，概念化。A·斯派塞·巴克（A. Spicer Bak）：撰写——审阅与编辑

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

这项研究得到了灾害风险、韧性和恢复跨学科研究中心（CIGIDEN R+）（CIN250023）的支持。PAC感谢ANID的资助FONDECYT 1170415，以及Valparaíso科学技术中心，ANID CCTVal（CIA250027）的支持。CV感谢ANID的资助FONDECYT 11230351。SB的资金支持来自USACE民用工程海岸海洋数据系统计划。RF感谢ANID FONDECYT的资助1231494。我们

热点排行

新闻专题

联系信箱：

粤ICP备09063491号