基于多模态音频表征与对比学习融合的猪咳嗽现场识别技术研究

【字体: 时间:2025年08月12日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  本文创新性地提出多模态猪音频表征与融合框架(MSS),通过对比学习整合梅尔频率倒谱系数(MFCC)和log-mel声谱图特征,实现猪呼吸道疾病早期临床咳嗽信号的精准识别(准确率达94.32%)。该研究突破传统方法依赖标注样本的局限,在训练样本减少50%时仍保持优异性能,为规模化养殖场呼吸道疾病预警提供可靠工具。

  

亮点

本研究提出的多模态猪音频表征与融合(MSS)框架显著提升了猪咳嗽识别的准确率。通过融合梅尔频率倒谱系数(MFCC)和log-mel声谱图特征,在简单线性分类器下即达到91.37%的准确率,经监督微调后进一步提升至94.32%,优于现有最先进方法。

多模态猪音频表征与融合结果

不同音频模态组合的实验表明,多模态融合能显著提升识别性能。MFCC + log-mel组合表现最佳(91.37%),证实两种特征具有互补性。值得注意的是,该框架在训练样本仅剩3%时仍能保持良好效果,展现出强大的小样本适应能力。

多模态猪音频表征的潜力

MSS框架通过对比学习实现了跨模态特征对齐,使单一模态特征识别准确率提升8-15%。该技术特别适用于实际养殖场复杂声学环境,能有效区分咳嗽与相似猪叫声,解决了传统方法在噪声干扰下的性能衰减问题。

结论

基于MSS框架的猪咳嗽识别方法为养殖场呼吸道疾病预警提供了新范式。其创新性体现在:1)首次将对比学习应用于猪音频多模态融合;2)突破标注数据依赖瓶颈;3)开发出适用于实际生产的轻量化解决方案。该技术已在中国农业大学的实验农场验证,具备产业化推广价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号