基于多模态音频表征与对比学习融合的猪咳嗽现场识别技术研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月12日 来源：Computers and Electronics in Agriculture 8.9

编辑推荐：

　　本文创新性地提出多模态猪音频表征与融合框架（MSS），通过对比学习整合梅尔频率倒谱系数（MFCC）和log-mel声谱图特征，实现猪呼吸道疾病早期临床咳嗽信号的精准识别（准确率达94.32%）。该研究突破传统方法依赖标注样本的局限，在训练样本减少50%时仍保持优异性能，为规模化养殖场呼吸道疾病预警提供可靠工具。

亮点

本研究提出的多模态猪音频表征与融合（MSS）框架显著提升了猪咳嗽识别的准确率。通过融合梅尔频率倒谱系数（MFCC）和log-mel声谱图特征，在简单线性分类器下即达到91.37%的准确率，经监督微调后进一步提升至94.32%，优于现有最先进方法。

多模态猪音频表征与融合结果

不同音频模态组合的实验表明，多模态融合能显著提升识别性能。MFCC + log-mel组合表现最佳（91.37%），证实两种特征具有互补性。值得注意的是，该框架在训练样本仅剩3%时仍能保持良好效果，展现出强大的小样本适应能力。

多模态猪音频表征的潜力

MSS框架通过对比学习实现了跨模态特征对齐，使单一模态特征识别准确率提升8-15%。该技术特别适用于实际养殖场复杂声学环境，能有效区分咳嗽与相似猪叫声，解决了传统方法在噪声干扰下的性能衰减问题。

结论

基于MSS框架的猪咳嗽识别方法为养殖场呼吸道疾病预警提供了新范式。其创新性体现在：1）首次将对比学习应用于猪音频多模态融合；2）突破标注数据依赖瓶颈；3）开发出适用于实际生产的轻量化解决方案。该技术已在中国农业大学的实验农场验证，具备产业化推广价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号