
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的保育猪个体健康风险早期识别:饲喂行为与体重数据的预测模型
【字体: 大 中 小 】 时间:2025年09月01日 来源:Journal of Animal Science 2.9
编辑推荐:
本研究针对生猪养殖中疾病监测的高成本与低效率问题,开发了基于机器学习(ML)的个体保育猪健康风险早期预警系统。研究人员利用21批次共1264头猪的每日采食量、饮水量和体重数据,通过随机森林(RF)、XGBoost等算法构建预测模型,发现饮水数据比采食数据更具预测价值,模型平均相关系数达0.22。该研究为自动化疾病监测提供了新思路,有望减少抗生素滥用并提高动物福利。
在生猪养殖业中,疾病每年造成数十亿美元的经济损失,如猪繁殖与呼吸综合征(PRRS)在美国的年损失达12亿美元。传统依赖人工观察的疾病监测方法存在效率低、主观性强等问题,而现有技术多聚焦群体水平预警。Saiara Samira Sajid等学者在《Journal of Animal Science》发表的研究,首次将机器学习应用于个体猪只的健康风险预测,为精准养殖提供了创新解决方案。
研究团队采用加拿大魁北克自然多病原体疾病挑战模型(NDCM)产生的独特数据集,包含21批次1264头保育猪的每日饲喂行为(采食量、饮水频率等)和体重数据。通过特征工程提取趋势特征(如线性回归斜率)和平均偏差特征,运用留一批交叉验证法评估了随机森林(RF)、极端梯度提升(XGBoost)等五种机器学习模型。
主要结果
模型比较:随机森林(RF)表现最优,准确率达60.8%,接收者操作特征曲线下面积(AUC)为0.63。集成模型(Ensemble)的预测概率与实际治疗结果的相关系数最高(0.25)。

批次差异:预测效果受批次间疾病压力动态变化影响显著,如批次82的相关系数为-0.18,而批次88达0.48。
数据价值:饮水行为数据比采食数据更具预测力,单独使用饮水特征时XGBoost相关系数提升至0.25。
时间窗口:第9-14天的体重变化是最重要预测指标,但单一特征预测力有限,需多特征组合。
讨论与意义
该研究首次证明个体行为数据可用于预测保育猪健康风险,但存在三大挑战:①批次间疾病压力差异导致治疗率预测困难;②神经网络(LSTM)因数据量不足表现不佳;③需结合环境传感器数据提升预测精度。研究成果为开发实时监测系统奠定基础,通过早期干预可减少抗生素使用(如批次水平治疗占比达25%),对推动可持续养殖和动物福利具有重要价值。未来需扩大数据规模并验证商业场景适用性,正如作者所述:"需额外特征或人工观察来改进早期识别"。

研究创新性地采用批量水平特征(占特征总数<25%)来捕捉群体疾病压力,这种"个体-群体"双维度分析框架为同类研究提供了方法论参考。尽管预测精度有待提升,但该工作标志着生猪健康管理从经验判断向数据驱动的重要转型。
生物通微信公众号
知名企业招聘