综述：人工智能在渔业中的应用：从数据到决策

《Big Data and Cognitive Computing》：Applications of Artificial Intelligence in Fisheries: From Data to Decisions

【字体：大中小】 时间：2026年01月11日 来源：Big Data and Cognitive Computing 4.4

编辑推荐：

　　本综述系统阐述了人工智能（AI）在渔业遗传学与监测、精准水产养殖（AIoT）、渔业管理及传感技术等领域的应用进展，涵盖了物种自动识别、环境DNA（eDNA）宏条形码、声学推断、数字孪生、强化学习（RL）控制等关键技术，并指出当前面临领域偏移、标注数据稀缺、模型不确定性量化不足及小规模生产者技术采纳不平等挑战，强调需通过标准化多区域基准、不确定性感知决策框架及隐私保护数据合作，推动AI从实验原型向可持续水生系统可靠基础设施的转变。

文献检索方法

本文采用结构化综述方法，检索了2015年1月至2025年6月期间发表的同行评审期刊文章、会议论文及部分技术报告，重点关注人工智能（AI）或机器学习（ML）在渔业或水产养殖问题中的应用，要求研究提供基本数据采样设计、样本量和上下文信息，并报告预测、分类、检测、控制或决策支持相关的定量性能指标。

人工智能在渔业遗传学与监测

近年来，计算机视觉、声学、环境DNA和基因组学的进步正在改变对野生鱼类种群的监测和评估方式。本节从水下图像中的个体检测任务入手，逐步深入到用于生态系统尺度评估框架的综合分子和多传感器方法。

物种检测与分类

当代卷积主干网络和高效检测器（如ResNet、YOLO、EfficientNet）显著提升了自动化物种识别的能力，在水下图像分类中可实现超过95%的准确率。然而，其性能易受栖息地变化（如浊度、光照、季节性）的影响，对于长尾或受保护类群（如板鳃类）的识别效果较差，这对种群评估和生态系统模型产生了影响。针对水下环境优化的架构，结合立体成像以稳定轨迹并减少浑浊水体中的重复计数，有助于提高鲁棒性。未来的发展依赖于涵盖兼捕和丢弃物类别的全面、标准化图像-性状数据集，以及支持性状信息评估的3D感知技术。

迁移学习与领域自适应

对预训练卷积神经网络（CNN）进行微调可以减少在新栖息地中大量标注的需求，但水域特定的偏差（如色偏和背向散射）会降低稀有物种的召回率。研究表明，开发水下专用检测器设计和确保时间一致性的视频优先流程，有助于提高不同地点和季节间的泛化能力。立体视频和多鱼跟踪数据集的最新进展支持主动学习和基于分歧驱动的标注，而将感知与SLAM/NeRF风格几何相结合，可为长期部署中的跨域迁移提供先验知识。

低分辨率和噪声图像处理

许多水下数据集分辨率低且受背向散射影响。通用超分辨率技术能增强感知细节，但存在幻觉风险，可能扭曲计数和长度等生态终点指标。将增强型超分辨率生成对抗网络（ESRGAN）等超分方法与下游检测器集成，并针对原生分辨率真值进行验证的任务感知流程，能在报告超分辅助检测不确定性的情况下，成功恢复识别性能并保持低误报率。方法开发必须强调在真实浊度条件下的校准和误差量化，以确保其适用于管理目的。

环境DNA（eDNA）监测

环境DNA（eDNA）宏条形码技术作为一种灵敏、非侵入性的方法，用于评估群落组成和季节性更替，有效补充了传统的基于渔具的调查。其在多种系统中与传统指数具有一致性。主要挑战包括将读数计数与丰度关联、考虑水文传输以及解决参考库不完整的问题。当前的指导强调标准化控制（如qPCR/dPCR和现场空白）、声学和视频指数的共同设计，以及将检测和传输不确定性明确纳入评估框架。

声学推断与多传感器融合

渔业声学的机器学习流程正朝着调查级集成方向发展，嵌入了声学分类器的估计方法。有线观测站表明，同步的视频和声学流可产生互补的生物多样性信号，但这凸显了对更广泛标记声学语料库和系统跨模态分析的需求。将声学、成像以及eDNA（如适用）进行协调且时间对齐的整合，并输出不确定性，为生态系统层面的操作监测和评估提供了实用途径。

基因组学与育种技术

群体基因组学和基因组编辑技术发展迅速，但基因组资源在商业和生态重要物种间的分布不均，且常规管理实践的采纳受限。多标记和多组学方法在阐明种群结构、局部适应性和连通性方面展现出潜力。CRISPR/Cas等基因组编辑技术正被探索用于增强水产养殖中的抗病性和生产性状，既带来技术机遇也伴随治理挑战。

基于性状和统计建模的方法

基于性状的指标和层次/混合效应模型越来越多地用于将生活史性状（如生长、成熟、寿命）与捕捞压力和气候变异联系起来，有效捕捉个体和种群水平的异质性。广义线性混合模型（GLMM）和线性混合效应模型（LMEM）的最新应用表明，在控制环境协变量后，群落性状组成与捕捞强度相关。然而，跨分类群和区域的性状数据库不一致限制了其普遍适用性。

人工智能在水产养殖中的应用

人工智能正在推动水产养殖从被动生产向适应性强、能够优化产量、动物福利、盈利能力和环境影响等多重目标的生产系统转变，尤其是在不确定性条件下。

自动化投喂系统

集成计算机视觉与序列模型（如CNN和门控循环单元GRU）的人工智能投喂器，能够准确预测短期饲料需求和生长，从而减少浪费并提高饲料转化效率。然而，大多数评估是短期的、物种特异性的，并在水箱环境中进行，限制了其在网箱和混合群体中的适用性。一种实用的方法是将视觉在环的生长估计与可解释的、自动重新校准的时间模型相结合，根据生物量和季节变化进行调整，同时利用实时水质预测来限制投喂量以防止餐后缺氧。

用于投喂优化的机器学习

监督机器学习技术，如梯度提升、支持向量回归和弹性网络集成，通过整合食欲线索、生长史和环境协变量来优化投喂量。模型常常对单一养殖场的遥测数据过拟合，并在传感器覆盖范围、密度或饲料配方发生变化时性能下降。部署必须实施特征治理（传感器质量控制、插补），进行领域偏移测试并定期重新训练，并利用不确定性感知 throttling 在置信度降低时减少投喂量。

强化学习控制器

在循环水养殖系统（RAS）中，强化学习（如深度确定性策略梯度DDPG）已在非线性动态中共同优化了投喂和水质控制。然而，训练过程需要大量数据，奖励函数设计敏感，且针对罕见灾难性事件（如曝气故障）的保障措施定义不足。利用监控与数据采集（SCADA）日志进行离线强化学习预训练，结合动作裁剪、严格的安全规则和物理信息替代模型，可以提高样本效率和安全性。

水质预测

应用于密集物联网（IoT）数据流的深度学习实现了溶解氧（DO）、pH值和氨氮（NH₃）的几小时提前预测，从而实现主动曝气和资源管理。脆弱性包括传感器污损、数据缺失以及随着生物量和温度制度变化而产生的概念漂移。有效的系统应将基于注意力或混合架构与自动间隙填充和漂移检测相结合，并将预测不确定性纳入控制逻辑。

福利与应激监测

视觉流程正从生物量和长度估计转向基于行为的福利指标，如异常游动和集群。然而，能见度差、拥挤以及商业养殖场稀疏的事件标签阻碍了泛化能力。整合被动视频、多目标跟踪和低成本环境传感可以提高可靠性。专注于疾病的检测器使用YOLO变体等鲁棒主干网络，在严格条件下病变和疾病检测率超过90%，但需要大量的标注工作。

收获预测与规划

整合生长史与投喂和环境数据的时间序列人工智能可以预测最佳收获期，并使物流与市场品质同步。然而，现有研究主要集中于回顾性分析，很少量化决策不确定性。将生长集成模型纳入数字孪生仪表板，显示置信区间，并根据天气和价格情景模拟替代收获日期，同时根据分级数据持续重新校准，可以提高盈利能力并降低风险。

用于气候情景模拟的人工智能模型

用于气候情景模拟的新兴生成式人工智能模型目前缺乏实证验证。产生看似合理但机制上缺乏依据的幻觉情景的可能性很大。将生成组件与物理信息约束相结合的混合方法显示出更大潜力，但仍处于实验阶段。生成式人工智能被用于评估养殖场在热浪、缺氧和病原体入侵等情景下的表现。

面向养殖户信任的可解释人工智能（XAI）

为了促进人工智能系统在商业水产养殖中的采用，其决策过程必须对操作者透明且可解释。被视作“黑箱”的模型虽然精度高，但在建议关键干预措施（如疾病治疗或收获时机）时往往难以建立信任。可解释人工智能（X解释人工智能）技术，如SHAP和Grad-CAM，越来越多地用于可视化影响模型预测的特征。

生物絮团系统优化

生物絮团技术（BFT）能有效回收营养物质和稳定水质，但操作者在管理碳氮比、曝气和温度相关的微生物动态方面面临挑战。将连续传感与絮团体积、硝化速率和污泥清除的预测模型相结合，并对异常微生物组状态发出警报，可以减轻操作者的负担。

人工智能物联网（AIoT）智能水产养殖

人工智能物联网（AIoT）技术栈，包括联网传感器和边缘/云分析，目前支持集成自动投喂、水质管理和疾病通知系统的“智能农场”。在互操作性、网络安全、连接性以及小规模生产者的投资回报率（ROI）方面仍然存在采纳挑战。

人工智能在渔业管理中的应用

现代渔业治理依赖于基于风险的管理，该管理将各种传感器数据与机器学习和人类监督相结合，以产生决策级指标。

非法、不报告和不管制（IUU）捕捞检测

对船舶自动识别系统（AIS）轨迹的机器学习分析越来越多地用于识别行为异常，如航向和速度变化、边界徘徊和可疑静默，有助于将执法工作优先针对高风险事件。然而，这些分析的有效性取决于信号的完整性和已验证标签的准确性。

全球捕捞努力量测绘

基于AIS的全球地图表明，工业化捕捞发生在超过一半的海洋中，极大地改变了治理的证据基础。然而，这些产品对个体和中小规模渔船的覆盖率不足，导致对足迹和公平性的评估存在偏差。

电子监测与兼捕检测

电子监控（EM）视频中使用的计算机视觉模型可以有效识别捕捞事件、量化渔获物并检测兼捕物种，从而扩大覆盖范围并减少对人类观察员的依赖。然而，标签稀缺、遮挡、摄像机放置可变以及混合渔获物阻碍了泛化能力和物种级准确性。

受保护物种监督

电子监控结合人工智能（EM + AI）有潜力在不同船只和渔具类型间标准化记录与受保护物种（如海龟、海鸟和海洋哺乳动物）的相互作用。对于稀有或隐秘类群，由于类别不平衡和训练集不足，性能受限，需要专家验证和严格的质量保证/质量控制（QA/QC）。

暗船队检测

夜光（VIIRS）和卫星雷达（SAR）能有效识别不广播信号的“暗”船，弥补了AIS数据的空白。然而，检测受天气和月光条件影响，并将检测结果与特定身份或活动关联起来具有挑战性。

人工智能增强的种群评估与决策支持

从数据密集型监测到决策质量建议的转变，需要将人工智能与种群动态模型相结合。传统的种群评估通常依赖于过度简化的假设，可能忽略了复杂的环境因素。预测技能指标用于在集成框架内验证综合评估模型，使管理者能够基于模型对未见数据的预测性能来客观评估或摒弃模型假设。

转运风险评估

AIS轨迹分析可以检测渔船与运输船之间的海上会合，从而加强检查针对性，打击非法渔获物的洗钱活动。然而，由于良性接近和不完整的AIS历史，可能会出现误报。

用于船舶检测的跨传感器融合

将AIS与光学和SAR影像相结合，增强了在海洋保护区（MPA）和专属经济区（EEZ）内对小船的检测能力。然而，依赖光学数据的云层覆盖、重访频率的限制以及计算需求阻碍了连续监测。

人工智能在传感与渔业技术中的应用

人工智能在渔业和水产养殖中的有效性从根本上取决于传感基础设施和计算框架的成熟度和可靠性。

声学回声迹分类

在最小标注的回声图上训练的弱监督卷积神经网络（CNN）可以自动化回声迹的标记，从而减少多物种中上层环境中专家的工作量。主要瓶颈包括缺乏标准化的多频率语料库、跨设备、频率和区域的领域偏移，以及分类误差向生物量指数传递的模糊性。

回声图中基于YOLO的鱼类检测

对YOLOv5进行修改以适应商业回声探测仪数据，有助于准确识别单个鱼和鱼群，并辅助仪器校准，从而实现近实时的操作应用。实际限制包括数据强度、对缺失 ping 或未校准仪器的敏感性，以及小型平台上的计算需求。

从检测到丰度估计

将机器学习结果整合到现有的丰度估计过程中，是实施渔业调查人工智能的一个重大挑战。高精度（如F1分数）是必要的，但如果分类中的偏差影响了生物量指数，则不足以用于管理决策。最近的框架展示了将基于深度学习的声学目标分类（ATC）整合到调查估计过程中。

近实时声学监测

集成机器学习流程的太阳能自主回声探测仪，能够以小时级的延迟流式传输和汇总生物量指标，从而解决传统调查的局限性。环境可靠性问题仍然存在，包括昼夜迁移和流动噪声，以及功率和遥测技术的限制，缺乏广泛的长期验证。

金枪鱼生物量估算（TUN-AI）

TUN-AI将浮标回声探测仪数据与梯度提升模型和海洋学原理相结合，在漂流鱼类聚集装置（dFAD）下预测流域尺度的生物量，从而辅助决策。已发现的差距包括物种组成不明确以及浮标和频率的变化；必须根据逐网次渔获量进行校准和验证。

通过被动声学检测鱼类声音

机器学习和深度学习技术逐渐用于检测和分类鱼类声音和行为，促进可扩展的生物多样性监测。主要挑战包括背景噪声、声源重叠以及缺乏包含上下文元数据的标记库。

轻量级目标检测模型

为小回声图目标设计的轻量级检测器（如YOLOv8-SBE）在准确性和延迟之间提供了有利的权衡，且参数更少，便于在船载和边缘部署。跨频率和跨流域的鲁棒性以及噪声条件下的性能仍未得到充分记录。

基础模型：多模态与具身人工智能系统

水生科学中人工智能的发展轨迹正从高度专业化的监督架构转向具有多模态推理、零样本泛化和语义理解能力的通用基础模型。

大型语言模型（LLM）

为海洋领域设计的大型语言模型，例如用于海洋科学的OceanGPT和用于水产养殖与渔业的AQUA，表明领域特定的指令微调和检索增强生成可以帮助研究人员、监管者和养殖户进行文献综合、方案总结和情景探索。

视觉-语言模型（VLM）

视觉-语言模型通过对齐图像和视频流中的视觉和文本表示来增强这些能力。通用模型如对比语言-图像预训练（CLIP）已在开放词汇识别和零样本迁移方面展现出能力；然而，其预训练数据集中对水生环境的有限和偏差表示限制了它们在水下场景中的有效性。

视觉-语言-动作（VLA）模型

视觉-语言-动作模型将感知和语言整合用于控制，使自主车辆能够理解高级自然语言指令并产生低级驱动命令。近期的水下框架，如集成U0控制器的水下系统集成与管理（USIM）和UnderwaterVLA，表明VLA架构可以通过整合多模态融合与任务级推理，促进多任务导航、检查和操作，同时在实际的水动力和通信约束下运行。

回声图的语义分割

U-Net和DeepLab风格的模型能有效划分离散散射体和聚集物，与启发式阈值法相比，提高了密度和生物量估计的准确性。尚未解决的挑战包括高昂的标注成本、标注者间的变异性、类别不平衡以及对频率依赖性外观的敏感性。

跨领域挑战

所有应用领域都存在结构性障碍，阻碍了从经过实验室验证的人工智能原型向可靠操作系统的过渡。

数据源、基准与数据集偏差

数据集的质量、组成和文档记录与模型架构的选择同样关键。像DeepFish这样包含约40,000张来自20个热带海洋栖息地的原位图像的大型公开基准，有助于在真实的栖息地复杂性和光照条件下系统比较检测和分割方法。许多研究报告了非常高的点准确率（通常为95%-99%），但这些结果源自类别数量有限、类别分布平衡且成像条件相对统一的精选数据集。

模型架构、训练协议与部署权衡

某些架构的流行，特别是用于检测的YOLO变体和用于分割的U-Net风格模型，反映了在速度、准确性和部署便捷性之间的实际权衡，而非固有的优越性。YOLOv5到YOLOv10等单阶段检测器及其轻量级变体（如LFN YOLO和YOLOv8 SBE）广泛用于标准GPU和嵌入式设备上的实时推理，同时在水下和回声图基准测试中达到有竞争力的平均精度（mAP）。

系统级架构：数字孪生、人工智能物联网与数据协作

集成数字孪生、人工智能物联网（AIoT）平台和数据协作的系统级架构通常被视为水产养殖和渔业数字化转型的顶峰。实证研究表明，这些举措是雄心勃勃的社会技术项目，需要持续的设计、校准和治理，而非现成的解决方案。

指标、不确定性与统计可靠性

文献中一个常见的局限性是依赖单次运行的点估计（如总体准确率、F1分数或平均精度mAP），而未考虑变异性或不确定性。在渔业和水产养殖中，这个问题因机器学习评估指标与管理目标之间普遍存在的不匹配而加剧。

操作鸿沟：从原型到决策

弥合数据与决策之间的差距仍然是渔业、人工智能和自动化发展的核心挑战。最近关于渔业中机器学习应用和捕捞策略设计的研究强调，算法只有被整合到透明的决策框架中，包含明确的目标、绩效指标和风险容忍度时，才能有效。

实际意义

对于政策制定者和监管者而言，基于融合的风险评分（AIS/VMS与SAR/VIIRS结合）、强制要求eDNA、声学和EM的不确定性报告，以及支持开放、版本化的基准，可以使人工智能与透明、可辩护的执法保持一致。渔业管理者和区域渔业管理组织（RFMO）应将不确定性感知的指数纳入捕捞控制规则，将暗船队检测与针对性巡逻相结合，并评估相对于成本的威慑和合规收益。水产养殖操作者可以部署具有漂移监测和置信度感知 throttling 的精准投喂和DO/pH/NH₃预测，嵌入用于收获和应急计划的数字孪生规划，并在生产力之外报告福利和环境关键绩效指标（KPI）。虽然联邦学习和差分隐私为数据共享提供了理论上的解决方案，但其实际实施面临技术障碍（通信开销、准确性损失）和制度障碍（责任、竞争担忧），这些问题在很大程度上仍未解决。对于研究人员而言，优先事项包括稀有类群语料库、物理和性状感知的数据增强、整合到决策中的保形或贝叶斯不确定性工具，以及量化真实操作价值的 manager-in-the-loop 试验。

结论

本综述综合了适用于渔业和水产养殖的人工智能最新进展，强调了当计算机视觉、声学推断、基因组分析和人工智能物联网（AIoT）架构被整合到精心设计的系统中时所具有的巨大潜力。本文概述了通过人工智能驱动的监测增强物种和性状检测，通过精准水产养殖工具提高生产效率和动物福利，以及通过多传感器融合加强监控、控制和监视。持续存在的系统级限制阻碍了从实验室原型向大规模操作基础设施的过渡。模型在不同领域的鲁棒性不足，经过训练的系统通常不能很好地泛化到不同的栖息地、季节、船队和渔具类型，特别是对于稀有和受保护类群。此外，标准化多区域数据集的可用性有限。不确定性很少从模型输出传递到评估和管理端点，使得决策者难以评估人工智能辅助建议的可靠性限度。治理和制度安排未能跟上技术创新的步伐：供应商之间的互操作性不完整，网络安全和数据隐私保护不一致，许多小规模经营者缺乏数据基础设施和对治理过程的影响力。