
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习赋能海草监测:基于视觉Transformer的鳗草自动检测与覆盖度估算研究
【字体: 大 中 小 】 时间:2025年05月30日 来源:Ecological Informatics 5.9
编辑推荐:
针对传统水下视频数据人工分析耗时且主观性强的问题,研究人员开发了SeagrassFinder平台,通过构建8,300余张标注图像数据集,评估ResNet、ViT等深度学习模型在鳗草(Zostera marina)二分类任务中的表现。结果显示ViT模型AUROC超0.95,结合水下图像增强技术提出新型覆盖度估算方法,为海洋生态自动化监测提供高效解决方案。
在全球气候变化和人类活动加剧的背景下,海草床作为"海洋之肺"正以惊人速度退化。这些水下开花植物虽仅覆盖2%的海底,却贡献了15%的海洋碳封存(Carbon Sequestration),同时支撑着20%的全球渔业产量。然而传统监测依赖潜水员勘测或遥感技术,前者成本高昂,后者受水体浊度限制且分辨率不足。环境评估(EIA)中常用的拖曳式摄像虽能获取精细影像,但人工标注效率低下——这正是哥本哈根Lynetteholm人工半岛项目面临的现实困境。
针对这一挑战,来自丹麦国际水环境研究所(DHI)的Jannik Els??er团队开发了SeagrassFinder系统,创新性地将深度学习引入海洋生态监测。研究通过构建8,300余张标注图像数据集,系统评估了ResNet、InceptionNetV3、DenseNet和视觉Transformer(ViT)在鳗草检测任务中的表现,相关成果发表于《Ecological Informatics》。
关键技术包括:1) 开发基于Azure云的标注平台SeagrassFinder AP实现高效数据标注;2) 采用迁移学习策略微调ImageNet预训练模型;3) 应用DeepWave-Net进行水下(UW)图像增强;4) 创新性提出基于30帧滑动窗口的时空覆盖度估算算法;5) 利用Tesseract引擎实现GPS坐标提取。所有数据来自丹麦海域6条深度2-14米的视频样带。
【数据采集与标注】
研究团队从20条视频样带中提取34万帧图像,经裁剪后形成16,000张样本库。通过定制化标注平台,19名标注者完成13,000次标注,Cohen's Kappa系数显示标注者间一致性达"基本完全一致"水平。值得注意的是,非专家标注者与专家表现无显著差异,验证了任务普适性。
【模型性能验证】
在四项递进式实验中,ViT-l-32模型展现出绝对优势:初始测试AUROC 0.938,经UW增强后提升至0.953;最终在保留测试集LYT-9上达到0.959,校准误差仅0.087。比较发现,DenseNet-201++虽表现优异,但训练耗时多2分钟且参数量达18.1M,而ViT仅需28分钟完成训练,凸显效率优势。
【覆盖度估算创新】
突破性地提出时空均值(TM)算法:将连续30帧(约10m2海床)的二元预测取均值,生成覆盖度热图。在150km外独立样带验证中,该方法与专家标注的Spearman相关性达0.3169(p=2.2331×10-8),虽存在小范围密集与大面积稀疏植被的等效估算局限,但大幅提升了评估客观性。
讨论部分指出,该研究首次将ViT应用于鳗草检测,其全局注意力机制克服了CNN的局部归纳偏置。通过GPS融合技术,成功绘制出哥本哈根港区鳗草分布热图,为蓝碳(Blue Carbon)战略提供数据支撑。值得关注的是,水下图像增强使模型在深水区表现更优,但需权衡每帧1.2秒的预处理耗时。
这项研究标志着海洋生态监测进入智能化时代。研究者特别强调,该方法可扩展至其他沉水植物(SAV)监测,未来与自主水下航行器(AUV)结合,有望实现实时生态评估。正如论文结论所述,在人类活动日益威胁海草生态的当下,此类自动化工具将成为海洋保护不可或缺的"数字守护者"。
生物通微信公众号
知名企业招聘