编辑推荐:
海草在海洋生态系统意义重大,传统监测方式存在弊端,且监督式机器学习受限于标注数据。研究人员提出两种算法估算海草覆盖度并分析深度极限。结果显示算法有效,能节省资源,为海洋生态监测助力。
在广袤的海洋世界里,海草如同神秘的水下森林,不仅是众多海洋生物的栖息地,还在全球碳储存方面发挥着重要作用。然而,对这片 “水下森林” 的监测却困难重重。以往,科研人员常用的监测手段,如借助潜水员和水下视频样带等,都需要专家手动调查评估海草状况,这一过程既繁琐又主观,不同专家的判断还可能存在偏差。而依赖卫星图像等遥感方法时,又会因水体光穿透限制、云层遮挡或水体浑浊等问题产生误差。同时,监督式机器学习在海草检测自动化进程中,也因缺乏大量标注图像而难以施展拳脚。在此背景下,为实现海草覆盖度的自动化、精准估算,丹麦技术大学的研究人员开展了深入研究,相关成果发表在《Environmental Modelling 》。
研究人员提出了两种创新算法,用于从潜水员获取的无标注水下视频中估算海草覆盖度,并探讨其不同潜力。这两种算法均基于边缘检测方法,提取海草特有的两种特征进行建模,进而实现覆盖度(0% - 100%)的估算,且能检测并纠正专家标注中可能出现的罕见错误。此外,研究人员还利用其中一种算法的估算结果,对海草生长的深度极限及其不确定性进行了分析。这一研究成果意义非凡,它不仅提高了海草监测的效率和准确性,还为海洋生态系统的有效管理提供了关键数据支持。
在研究方法上,主要涉及以下关键技术:
- 数据预处理:针对丹麦沿海生态系统中海草的尖锐边缘特征,运用线检测算法(LSD)从视频帧中提取边缘。计算每个视频帧的 “线数量”(Feature 1)和 “线总长度”(Feature 2)这两个特征,并对视频进行采样、去噪和特征平均处理。
- 方法 1:通过寻找合适的归一化因子,将特征值转化为 0 - 1 之间的数值作为覆盖度的代理值。考虑两个特征的不同特性,采用线性组合构建覆盖度指数,经网格搜索确定最佳权重,最终得到海草覆盖度的百分比估算值。
- 方法 2:运用高斯混合模型(GMM)对数据进行聚类分析。利用 Akaike 信息准则(AIC)和贝叶斯信息准则(BIC)确定最优聚类数,将视频帧分配到不同聚类,以聚类概率作为海草覆盖度的代理值。
- 深度极限估算:基于丹麦水力学研究所提供的深度数据和方法 1 的海草覆盖度估算结果,以 10% 覆盖度为阈值定义深度极限。通过添加白噪声和红噪声进行敏感性分析,评估深度极限估算的稳健性。
研究结果如下:
- 检测与量化方法对比:检测式方法(如基于 GMM 的存在 / 不存在判断和基于线数量阈值的判断)和量化方法(方法 1 和方法 2)在估算海草覆盖度时各有优劣。检测式方法在某些情况下会高估或低估海草覆盖度,而量化方法能更细致地反映覆盖度情况。例如,在不同覆盖度特征的区域对比中,存在 / 不存在法会出现误判,而量化方法能避免此类问题。
- 方法 1 与方法 2 对比:方法 1 能直接将线数量和线总长度转化为定量指数,可实现 0% - 100% 间任意值的覆盖度估算,在高覆盖区域表现良好;方法 2 基于概率映射,更适合预测覆盖度范围或离散区间,但在处理极高或极低覆盖值时存在局限。
- 深度极限分析:经筛选,14 个视频样带中有 4 个符合深度极限分析标准。通过平滑覆盖度指数与深度的关系曲线,确定深度极限。敏感性分析表明,红噪声对深度极限估算影响较小,不同覆盖度阈值下的深度极限估算结果均在合理范围内。
在结论与讨论部分,研究人员指出,海草覆盖度估算存在一定主观性,而本研究提出的两种方法具有较高的稳健性,能有效检测专家预测中的罕见错误。方法 1 适用于点估计,在高覆盖区域效果良好;方法 2 则更适合区间覆盖度估算。此外,利用方法 1 估算的覆盖度可进一步估计深度极限,其结果对噪声具有稳健性,且与独立评估的深度极限相符。该研究实现了海草覆盖度估算的自动化,节省了时间和资源,其方法还可拓展应用于其他具有尖锐边缘特征的植被检测。同时,研究结果有望为基于哨兵 - 2 卫星图像的植被测绘提供地面真值,也为训练半监督机器学习模型获取其他区域的覆盖度估计提供支持。然而,由于数据保护法规限制,难以获取全球通用模型,未来可考虑采用联邦学习等技术解决这一问题。