
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态音频表征与对比学习融合的猪咳嗽现场识别技术研究
【字体: 大 中 小 】 时间:2025年08月12日 来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
本文创新性地提出多模态猪音频表征与融合框架(MSS),通过对比学习整合梅尔频率倒谱系数(MFCC)和log-mel声谱图特征,实现猪呼吸道疾病早期临床咳嗽信号的精准识别(准确率达94.32%)。该研究突破传统方法依赖标注样本的局限,在训练样本减少50%时仍保持优异性能,为规模化养殖场呼吸道疾病预警提供可靠工具。
亮点
本研究提出的多模态猪音频表征与融合(MSS)框架显著提升了猪咳嗽识别的准确率。通过融合梅尔频率倒谱系数(MFCC)和log-mel声谱图特征,在简单线性分类器下即达到91.37%的准确率,经监督微调后进一步提升至94.32%,优于现有最先进方法。
多模态猪音频表征与融合结果
不同音频模态组合的实验表明,多模态融合能显著提升识别性能。MFCC + log-mel组合表现最佳(91.37%),证实两种特征具有互补性。值得注意的是,该框架在训练样本仅剩3%时仍能保持良好效果,展现出强大的小样本适应能力。
多模态猪音频表征的潜力
MSS框架通过对比学习实现了跨模态特征对齐,使单一模态特征识别准确率提升8-15%。该技术特别适用于实际养殖场复杂声学环境,能有效区分咳嗽与相似猪叫声,解决了传统方法在噪声干扰下的性能衰减问题。
结论
基于MSS框架的猪咳嗽识别方法为养殖场呼吸道疾病预警提供了新范式。其创新性体现在:1)首次将对比学习应用于猪音频多模态融合;2)突破标注数据依赖瓶颈;3)开发出适用于实际生产的轻量化解决方案。该技术已在中国农业大学的实验农场验证,具备产业化推广价值。
生物通微信公众号
知名企业招聘