
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于SAM合成数据与深度学习的鲑鱼虱幼虫多阶段检测方法研究及其在海水环境中的应用
【字体: 大 中 小 】 时间:2025年09月25日 来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
本研究针对海水环境中鲑鱼虱(Lepeophtheirus salmonis)幼虫检测面临的数据稀缺和标注成本高的问题,开发了一种基于Segment Anything Model(SAM)的合成数据生成框架。通过正交实验优化生成参数,构建了包含120,864张图像的高质量数据集,并采用预训练-微调策略显著提升了YOLO系列和RT-DETR-L模型的检测性能(F1-score最高提升24.22%)。在真实海水样本验证中,该方法召回率达到87.0%-97.5%,优于专业生物学家的检测水平,为大规模海洋寄生虫监测提供了可扩展的解决方案。
在挪威等北欧国家的三文鱼养殖产业中,鲑鱼虱(Lepeophtheirus salmonis)感染已成为威胁养殖和野生鲑鱼种群可持续发展的主要生物性灾害。这种寄生虫在浮游幼虫阶段(包括无节幼体Nauplius和桡足幼体Copepodite)即可通过水体传播,单个养殖场每日可释放数百万只幼虫,其扩散范围可达200公里。传统的显微镜观察和分子检测方法存在效率低、成本高、无法区分发育阶段等局限性,而现有机器学习方法又受限于复杂海水环境中标注数据的缺乏。
面对这一挑战,研究人员开发了一种基于Segment Anything Model(SAM)的自动化合成数据生成方法,旨在提升真实海水环境中多阶段鲑鱼虱幼虫的检测能力。该研究通过54组正交实验优化了合成数据生成的参数配置,最终构建了包含120,864张图像的高质量数据集。通过系统评估YOLO系列模型和Transformer基础的RT-DETR-L模型,研究发现采用合成数据预训练后再进行微调(或混合训练)的策略能显著提升模型性能。这项研究成果发表于农业信息技术领域权威期刊《Computers and Electronics in Agriculture》,为大规模海水环境中鲑鱼虱幼虫监测提供了创新性解决方案。
关键技术方法包括:1)使用定制化数据采集装置采集海水样本并构建包含4,196张原始图像的数据集;2)基于SAM模型实现目标生物(鲑鱼虱幼虫)和非目标颗粒的实例分割;3)通过泊松盘采样和物理增强技术生成合成图像;4)采用正交实验设计优化10个关键生成参数;5)对比四种训练策略(原始训练、合成数据训练、微调训练和混合训练)的性能差异。
研究结果方面:
2.1 数据准备
通过潜水泵配合120μm滤网采集海水样本,经分级过滤和实验室培育幼虫添加后,使用显微摄像系统获取图像。数据集包含2,398个无节幼体和1,988个桡足幼体实例,按6:1:1:2比例划分为训练集、验证集、正交开发集和最终测试集。
2.2 数据合成方法
采用分割-粘贴范式,使用边界框提示分割目标生物,随机点提示分割非目标颗粒。通过实例大小变换(IST)、方向变换(IOT)、对比度调整(CA)、光照调整(IA)、运动模糊(MB)和高斯模糊(GB)等增强技术提升数据多样性。关键控制因素包括背景图像比例(BOI)、合成图像乘数(SIM)、最大目标实例数(MNS)和最大非目标实例数(MNN)。
2.3 实验设置
正交实验采用L54(2139)设计,使用YOLOv11n模型评估不同参数组合对合成数据质量的影响。结果显示MNN(范围0.1669)和SIM(范围0.1336)对性能影响最大,最优配置为MNN=80,SIM=16,IST=1,MNS=3,IOT=True。
3.1 正交实验
范围分析表明因素影响排序为:MNN > SIM > IST > MNS > IOT > MB > CA > GB > BOI > IA。高水平MNN和SIM显著提升模型性能,而过度增加目标实例数量反而会降低数据质量。
3.2 模型训练策略
微调策略表现最优,相比原始数据训练,F1-score提升8.85%-24.22%。轻量级模型(如YOLOv8n)受益最大,F1-score从70.6%提升至87.7%。混合训练在YOLOv9m上达到最佳性能,F1-score为91.7%。
3.3 现场验证
在2024年8月和2025年2月采集的真实海水样本中,合成数据增强模型的整体召回率达到87.0%-97.5%,显著优于仅使用原始数据训练的模型(55.6%-85.2%)和已有方法(53.1%-60.5%)。YOLOv8n和YOLOv9m模型检测到79个无节幼体和全部10个桡足幼体,召回率达97.8%,甚至超过专业生物学家的检测水平(82.2%)。
研究结论与讨论部分强调,该合成数据方法有效解决了海洋生物检测中数据稀缺的共性难题。通过优化背景复杂性和数据规模(MNN和SIM),而非单纯增加目标实例数量,能够显著提升模型在真实环境中的泛化能力。该方法特别有利于轻量级模型部署,适用于电池供电的海洋监测系统,实现远程环境的持续监测。尽管在严重遮挡情况下性能仍受限,但通过多帧检测可部分补偿这一局限。未来工作将整合荧光检测技术和时序信息,进一步提升在复杂水体中的检测精度。这项研究不仅为鲑鱼虱防控提供了技术支撑,其方法论也可推广到其他海洋生物监测场景,对发展智慧渔业和海洋生态保护具有重要意义。
生物通微信公众号
知名企业招聘