《Scientific Data》:Features of interest from a multi-season satellite survey of baleen whales on the West Antarctic Peninsula
编辑推荐:
本刊推荐:为应对极地野生动物遥感研究中训练数据匮乏的挑战,研究人员通过多季节高分辨率卫星影像(WorldView-3)对西南极半岛威廉米娜湾进行系统扫描,构建包含819个标注特征点(FOIs)的须鲸识别数据集。该数据集采用标准化分类协议(Cubaynes et al.)和置信度评分体系(Bamford et al.),为机器学习算法提供高质量训练样本,显著提升极地海洋哺乳动物自动化监测效率。
在南极的冰海交界处,庞大的须鲸群落在夏季聚集觅食,但传统的船基调查受限于恶劣环境难以全面覆盖。近年来,极高分辨率卫星影像(VHR)为极地野生动物研究开辟了新途径。然而,海量卫星数据的处理依赖自动化算法,而算法训练所需的人工标注数据却极度匮乏——这既因手动标注耗时巨大,又受卫星影像版权限制难以共享原始数据。尤其对须鲸而言,不同海域的水色、浊度差异会显著影响检测效果,极地环境的特异性使得通用训练数据集难以直接迁移。
为此,由英国南极调查局领衔的国际团队在《Scientific Data》发表论文,发布了首个针对西南极半岛威廉米娜湾的多季节须鲸卫星调查数据集。研究团队通过2018-2022年间三个南极夏季的WorldView-3卫星影像(0.31米全色分辨率),由7名观测者系统扫描约1,900平方公里海域,最终标注819个须鲸特征点(FOIs),并按照标准化协议进行三级置信度分类(明确/可能/未分类)。该数据集不仅为极地海洋哺乳动物自动化监测提供关键训练样本,更建立了可复制的极地鲸类卫星识别方法论。
研究方法核心包括三个层面:首先基于鲸群密度、冰情与光照条件选定威廉米娜湾作为典型研究区;其次采用ESRI算法对卫星影像进行全色锐化处理,由观测者按0.0125平方公里网格系统扫描并标注特征点;最后通过多指标评分体系(参考Cubaynes et al.和Bamford et al.的权重公式)对特征点进行三级分类,并同步记录海况、海冰与云覆盖等环境参数。
研究结果通过多维度数据呈现:
- 1.
影像获取与扫描覆盖
三季共获取18景卫星影像,单景平均扫描面积115.50平方公里(SD=37.92),覆盖影像总面积的74.64%。2021-2022季节因冰情影响扫描面积波动最大(SD=27.10),体现了极地环境动态性对监测的制约。
- 2.
特征点分类与时空分布
819个特征点中明确级鲸类71个(8.7%),可能级71个(8.7%),未分类677个(82.6%)。2019年3月11日影像中明确鲸类数量达峰值(24个),而2022年1月11日影像虽捕获211个特征点,但仅1个达明确级,揭示影像质量与环境条件对识别置信度的显著影响。
- 3.
观测者一致性与质量控制
通过多观测者交叉验证(表2)和拉梅伯特方位等积投影(LAEA)的空间配准,降低个体判读偏差。研究特别报道了2019年2月21日影像中12头疑似喙鲸的群体(图2),展示卫星遥感对稀有鲸种的探测潜力。
- 4.
环境参数记录体系
创新性建立特征点级环境量表(图3),涵盖海况、海冰与云覆盖三要素,为后续模型训练提供噪声校正依据。数据显示未分类特征点多集中于高海冰覆盖率区域,印证环境复杂度对识别准确率的干扰。
这项研究的意义超越数据集本身:其一,建立首个南极须鲸卫星识别标准化流程,为极地生态长期监测提供范式;其二,通过开放819个经人工校验的特征点,显著降低机器学习算法开发门槛;其三,证实混合物种海域中物种级识别的可行性边界,为后续多物种识别算法设计指明方向。随着卫星分辨率提升与深度学习技术融合,该数据集将助推极地鲸类研究从“样本普查”迈向“种群动态解析”的新阶段。