
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:相同数据,不同结果?生物声学中的机器学习方法
【字体: 大 中 小 】 时间:2025年07月10日 来源:Methods in Ecology and Evolution 6.2
编辑推荐:
这篇综述系统评估了16种哺乳动物声学数据中特征提取(MFCC/LFCC/时频特征/HCTSA)和分类方法(DFA/NN/RF/SVM)的组合效果,发现梅尔频率倒谱系数(MFCC)与随机森林(RF)的组合能提供最稳定可靠的个体识别结果,为跨物种生物声学研究建立了标准化分析框架。
生物声学研究的标准化之路
摘要
自动声学分析在行为生态学中的应用日益广泛,其中个体识别是许多研究的关键环节。然而,特征提取和分类方法的差异限制了不同物种和研究结果的可比性。这项研究通过系统评估不同方法组合在16种哺乳动物数据集上的表现,为建立标准化分析流程提供了重要依据。
文献现状
通过对2000-2022年文献的系统回顾发现:52.9%研究使用判别函数分析(DFA),但仅11.1%验证了数据是否符合假设;47.9%的研究未说明特征选择依据;使用的41种特征参数和18种分类器呈现高度碎片化。灵长类(43.5%)、食肉目(23.9%)和翼手目(6.5%)是研究最集中的类群。
方法学比较
研究设计了严谨的实验方案:
关键发现
跨物种稳定性
MFCC特征配合RF分类器展现出最佳稳定性:
LFCC与MFCC表现相当,验证了倒谱系数对高频动物的适用性。而HCTSA虽能提取7947维特征,但存在明显过拟合风险。
样本量影响
30个样本/个体即可获得稳定结果:
应用建议
基于证据提出标准化流程:
该框架已成功应用于羊驼、家猫、埃及果蝠等14物种的16种叫声分析,为理解哺乳动物声音通讯的进化意义提供了可比性基础。未来研究可结合深度学习等新兴技术,进一步探索声学个体识别的生物学机制。
生物通微信公众号
知名企业招聘