
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于SAM图像合成框架的复杂海水中鲑鱼虱幼虫检测方法研究及其应用
【字体: 大 中 小 】 时间:2025年09月25日 来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
本研究针对复杂海水环境中鲑鱼虱(Lepeophtheirus salmonis)幼虫检测数据稀缺、标注成本高的问题,提出了一种基于Segment Anything Model(SAM)的图像合成框架。通过双提示分割和物理增强技术生成高质量合成数据,结合正交实验优化参数配置,显著提升了YOLO系列和RT-DETR-L模型的检测性能。在真实海水样本测试中,模型召回率提升11.0%~87.0%,甚至超越专业生物学家的检测能力,为大规模海洋寄生虫监测提供了可扩展的解决方案。
在挪威等全球主要鲑鱼养殖地区,鲑鱼虱(Lepeophtheirus salmonis)感染已成为威胁养殖和野生鲑鱼种群可持续发展的重大挑战。这种寄生虫在幼虫阶段(包括无节幼体(Nauplius)和桡足幼体(Copepodite))就具有感染能力,早期检测对控制其传播至关重要。然而,传统检测方法如PCR分子技术成本高昂且难以大规模应用,而现有机器学习方法又受限于复杂海水环境中标注数据的缺乏,大多只能在简化的实验室条件下进行,难以应对真实海洋环境的复杂性。
更具体的问题在于,海水中的鲑鱼虱幼虫体型微小(约5μm/像素)、分布稀疏,且与大量形态相似的浮游生物共存,使得人工标注极其困难。虽然Zhang等(2024)开发了基于机器视觉的检测方法,但仍需大量标注数据支持,而Zheng等(2024)的合成数据方法又仅限于单一发育阶段和简单背景,生态真实性不足。这些限制严重阻碍了高效、自动化监测系统的发展。
为解决这些挑战,本研究团队开发了一种基于Segment Anything Model(SAM)的图像合成框架,专门用于增强复杂海水环境中多阶段鲑鱼虱幼虫的检测能力。该研究成果已发表在《Computers and Electronics in Agriculture》期刊上。
研究采用了几个关键技术方法:首先通过定制化数据采集装置从挪威鲑鱼养殖场采集海水样本,经滤网浓缩后获取原始图像;利用SAM模型进行双提示分割(边界框提示用于目标生物,随机点提示用于非目标颗粒),提取鲑鱼虱实例和背景生物;采用泊松盘采样分布合成新图像,并结合物理增强技术(包括生物约束的缩放旋转、光照调制、运动模糊等);通过54组正交实验优化10个关键因子的配置;最后使用YOLO系列(v5su/v8n/v9m/v10n/v11n)和Transformer-based RT-DETR-L模型进行性能验证,并采用多种训练策略(合成数据预训练、原始数据微调、混合训练)进行对比。
2.1. 正交实验优化合成数据生成因素
通过54组正交实验发现,非目标实例最大数量(MNN)和合成图像乘数(SIM)对合成数据质量影响最大(范围R分别为0.1669和0.1336),而传统增强因素如运动模糊(MB)和对比度调整(CA)影响较小(R<0.02)。最优参数配置为MNN=80、SIM=16、MNS=3、IST=1(无缩放),此配置下生成的合成数据集(Opt-SynSet)包含120,864张图像,显著提升了模型性能。
2.2. 不同训练策略下的模型性能比较
在合成数据上预训练后微调原始数据的策略(FT-SYT)表现最佳,使YOLOv8n的F1分数从70.6%提升至87.7%(相对改进24.22%), recall从66.6%提升至86.6%。混合训练策略在YOLOv9m上获得最优效果(F1=91.7%)。Transformer-based RT-DETR-L模型在微调策略下达到最高精度(93.7%)和F1分数(90.5%)。多阶段检测中,"桡足幼体"(Copepodite)检测性能(F1=93.9%)优于"无节幼体"(Nauplius)(F1=90.7%),但后者改进幅度更大(平均提升16.4%)。
2.3. 真实海水样本的现场验证
在2024年8月和2025年2月采集的挪威海水样本中,合成数据增强模型的整体召回率达到87.0%-97.5%,较基线模型(55.6%-85.2%)提升显著,甚至超过专业生物学家的检测水平(82.2%)。YOLOv8n和YOLOv9m模型检测到79个无节幼体和全部10个桡足幼体,召回率达97.8%。模型表现出良好的跨时空泛化能力,有效应对了生物组成变化和环境复杂性。
本研究通过SAM驱动的图像合成框架,成功解决了复杂海水环境中鲑鱼虱幼虫检测的数据稀缺问题。正交实验揭示环境复杂性因素(MNN、SIM)对合成数据质量的影响远大于目标特定因素,这表明在海洋生物检测中,增强生态环境真实性比单纯增加目标实例更有效。合成数据预训练与微调策略的结合不仅显著提升了模型性能(最高F1分数改善24.22%),还缩小了不同规模模型间的性能差距,使轻量级模型(如YOLOv8n)也能达到接近大型模型的检测精度。
现场验证结果表明,该方法在真实海洋环境中具有卓越的适用性和鲁棒性,检测性能甚至超越人工专家,为大规模、实时海洋寄生虫监测提供了切实可行的技术方案。该框架的可扩展性使其能够快速适应不同地理区域和季节变化,只需加入当地代表性样本即可生成针对性合成数据,这为全球水产养殖业的可持续发展提供了重要技术支撑。
未来研究可进一步整合荧光成像技术,通过多光谱特征融合提高在浮游生物密集水域的鉴别能力;同时引入时序分析模块,利用幼虫运动特性减少误检,最终实现全自动化、高精度的海洋生物监测系统。
生物通微信公众号
知名企业招聘