综述:计算机视觉在非接触式表型分析和牲畜体重估算方面的最新进展:一项系统综述
《Information Processing in Agriculture》:Recent advances in computer vision for non-contact phenotyping and weight estimation in livestock: a systematic review
【字体:
大
中
小
】
时间:2025年11月08日
来源:Information Processing in Agriculture 7.4
编辑推荐:
计算机视觉技术在牲畜体型测量与体重估算中的应用进展及挑战。本文系统综述了2014-2025年间2D图像、3D点云及多模态融合方法在奶牛、猪、羊等物种中的研究进展,比较了传统几何方法、机器学习与深度学习模型在核心算法框架、传感器类型、误差精度(2D:5%-8%误差,3D:3%-5%)及R2值(>0.95)上的差异,指出数据标注不足、多视角点云注册困难、跨场景适应差等关键挑战,并建议加强多源数据融合、模型迁移学习及轻量化设计。
在当今快速发展的农业技术背景下,精准畜牧养殖(Precision Livestock Farming, PLF)逐渐成为提高生产效率、保障动物福利以及实现可持续发展的关键手段。传统的畜牧测量方法,如手动测量和使用工具如量尺或电子秤,虽然在某些情况下仍然适用,但其在精度、效率和动物健康方面存在明显局限。随着计算机视觉(Computer Vision, CV)技术的不断进步,特别是结合了机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)的非接触式测量技术,正在成为解决这些问题的重要方向。本文系统回顾了基于2D图像、3D点云以及融合方法在牛、猪和羊等牲畜的表型测量中的最新进展,探讨了这些技术的核心算法、传感器类型、姿态标准化方法和回归模型的表现,并指出了当前研究中存在的主要挑战和未来发展方向。
### 传统方法的局限性
传统测量方法依赖于人工操作,通常需要动物保持静止状态,以便于测量。这种方法不仅耗时费力,而且容易受到人为误差的影响,同时频繁的测量行为还可能引起动物应激反应,影响其健康和生产性能。例如,测量体高和体长时,通常需要动物站立不动,而测量胸围和臀围则需要精确的工具和技巧。此外,传统方法在测量不同种类牲畜时往往需要特定的设备,如大型牲畜可能需要电子秤,而小型牲畜则可能需要便携式秤或悬挂秤。这些方法虽然在某些特定场景下仍然有效,但它们在面对复杂环境、动态场景和大规模应用时显得不够灵活和高效。
### 计算机视觉技术的兴起
近年来,计算机视觉技术在畜牧领域获得了广泛的关注。CV技术通过使用2D图像、3D点云数据以及结合传统几何方法或先进机器学习和深度学习算法,实现了对牲畜体型和体重的准确、快速和自动识别。这一技术不仅减少了对人工操作的依赖,还显著提高了测量的效率和准确性。同时,CV技术还能有效降低动物应激反应,提高动物福利,因此在畜牧行业转型升级中扮演着越来越重要的角色。
### 技术分类与性能对比
当前非接触式测量方法主要分为三类:基于2D图像的计算机视觉方法、基于3D点云的计算机视觉方法以及融合2D和3D数据的多模态方法。基于2D图像的方法通常具有较低的部署成本,但其测量误差范围在5%到8%之间。相比之下,基于3D点云的方法能够显著降低误差,达到3%到5%的水平,并且回归模型的R2值通常超过0.95。深度学习模型在动态和遮挡环境下表现出更强的鲁棒性,这使得它们在复杂农场环境中具有更好的适应性。
### 2D图像处理方法
2D图像处理方法通常利用RGB摄像头、深度传感器、多摄像头阵列和LiDAR系统等设备,生成颜色图像、深度图、多视角图像和3D点云。这些方法通过图像处理技术提取关键点或轮廓,然后利用几何关系和比例估算体型,并通过经验公式、机器学习方法和回归模型预测体重。例如,使用2D图像进行测量时,可以通过图像二值化和形态学操作去除噪声,并将牲畜从背景中分离出来。随后,提取牲畜背部的投影面积、周长和曲率等特征,并通过这些特征进行体重估算。这种方法虽然相对成熟且计算需求较低,但在实际应用中仍面临透视失真、比例校正和遮挡等问题,导致其精度和鲁棒性有限。
### 3D点云处理方法
3D点云处理方法通过使用深度相机或其他3D传感器,从多个视角获取牲畜的三维信息,从而实现更全面的形态分析。在文献检索中,研究人员通常使用1至5个3D传感器进行3D重建,并采用7至9个摄像头进行更深入的研究。然而,使用更多摄像头意味着需要更精确的坐标系统统一,以消除由于注册效果不佳导致的误差。在处理3D点云数据时,还需要进行预处理、注册、区域分割、关键点提取等步骤,以提取体型信息并预测体重。例如,通过使用DBSCAN(基于密度的空间聚类)等算法,可以有效区分牲畜的背部点云与地面点云。通过去噪和椭圆拟合等处理,可以提取表面面积、宽度和体积等关键特征,以获得更准确的体型数据。这些方法在复杂姿态或遮挡环境下表现出更高的鲁棒性,但需要更多的计算资源。
### 多模态融合方法
为了进一步提高测量的精度和通用性,研究人员开始探索2D图像与3D点云的多模态融合方法。这些方法旨在结合两种技术的优势,克服单一技术的局限性。例如,一些研究使用结构从运动(Structure from Motion, sfM)算法,通过多视角2D图像重建稀疏点云,并建立点云与图像之间的映射关系。这种方法具有低成本和简单设备的优点,但在静态场景中需要确保足够的视角重叠,同时强光和阴影可能引入噪声,影响重建质量。为了解决这些问题,可以采用多传感器协同工作的解决方案,如结合TOF、LiDAR、红外传感器等,并通过卡尔曼滤波或粒子滤波等方法整合数据,以消除单一传感器的不稳定性。此外,动态隐式表达方法,如动态3DGS(3D Gaussian Splatting)、稀疏卷积点云网络、Tiny-NeRF和FlashGS,显著提高了注册的实时性能和鲁棒性。结合骨骼驱动变形场、增量优化和边缘-云协作技术,动态牲畜“行走中称重”成为可能。
### 传感器与数据采集挑战
在牲畜表型测量过程中,数据采集面临诸多挑战。例如,光照变化和复杂的背景环境可能干扰图像质量,而牲畜频繁的移动和呼吸变形也使得数据采集难以达到实际应用所需的准确性和速度。此外,密集群体中的个体容易相互粘连,导致分割困难。为了应对这些挑战,可以采用数据增强技术,减少对自然光的依赖,并设置固定的采集点以确保背景干净。点云数据可以通过动态背景分割或深度学习分割网络进行分离。对于牲畜的移动问题,可以使用高帧率摄像头和多传感器融合,覆盖盲区,并通过时间戳等硬件触发机制解决采集同步问题。同时,可以通过食物或声音引导牲畜短暂静止,结合时间序列分析进行变形跟踪。对于密集群体和遮挡问题,可以采用图像分割、实例分割、深度学习、生成对抗网络(GANs)和自注意力机制等方法,以捕捉距离关系或采用多视角立体重建技术进行解决。
### 模型泛化与跨场景适应性
模型的泛化能力和跨场景适应性仍然是当前研究中的关键挑战。例如,某些模型在室内RGB-D数据集上的平均绝对误差(MAE)仅为2.3kg,但在露天牧场中误差可能上升到12-15kg。此外,使用同一模型对不同种类牲畜进行测量时,模型性能往往会下降。为了提高模型的泛化能力,可以采用多模态融合和对抗域适应等方法,同时结合品种标签、毛发长度等辅助输入,提高模型的适应性。然而,由于牲畜形态的多样性以及品种的丰富性,公共的大规模动物数据仍然稀缺。因此,未来的研究应优先考虑构建覆盖多种牲畜和环境的大规模、开放性数据集,并通过自监督学习和域适应技术提高跨域迁移能力。
### 未来发展方向
未来的研究方向应包括以下几个方面:一是构建涵盖多种牲畜和环境的大规模、开放性数据集,以提高模型的泛化能力和跨场景适应性;二是引入Transformer架构和跨注意力机制,以实现更深层次的多模态融合;三是采用自监督学习和域适应技术,以提高模型在不同环境下的迁移能力。此外,还需进一步优化点云注册和姿态标准化技术,以及设计适用于边缘计算的轻量级模型,以实现实时、现场适用的部署。通过这些技术的不断进步,计算机视觉在精准畜牧养殖中的应用将更加广泛,为提高畜牧业的生产效率、动物福利和可持续发展提供强有力的技术支持。
### 商业应用与前景
在中国,计算机视觉技术已经逐步应用于畜牧业的商业实践。例如,一些地区已经部署了“智能养猪系统”,实现了对猪只体重和健康状况的非接触式实时监测。该系统在黑龙江、内蒙古、吉林、甘肃和广东等地的养猪场中得到应用,测量准确率超过95%。通过FeedSaaS平台,该系统能够提供精准的饲料配方和决策支持,同时支持高达98%准确率的自动化牲畜库存管理,显著提高了管理效率和经济效益。这些案例表明,计算机视觉技术正逐步向工业应用迈进,并为服务提供商和农场经营者提供了实际参考。然而,目前完全商业化的基于视觉的牲畜体型测量系统仍然较为稀缺,大多数解决方案仍处于实验室或试点阶段。因此,未来的研究应更加注重克服模型在多样环境中的泛化能力、硬件适应性和成本效益,以加速体型和体重测量技术从实验研究向大规模商业应用的转变,推动精准畜牧养殖和行业升级。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号