基于潜在空间核自适应滤波的轻量化工业声源定位方法研究
《MECHANICAL SYSTEMS AND SIGNAL PROCESSING》:Latent deep-kernel filtering for lightweight and robust industrial sound source localization
【字体:
大
中
小
】
时间:2025年11月04日
来源:MECHANICAL SYSTEMS AND SIGNAL PROCESSING 8.9
编辑推荐:
本文针对工业环境中声源定位(SSL)面临的复杂声学条件和边缘设备资源受限等挑战,提出了一种新型的潜在空间核自适应滤波(LS-KAF)框架。该研究通过编码器-滤波器-解码器范式,将深度表示学习与核自适应滤波(KAF)相结合,成功实现了在保持轻量级结构的同时显著提升定位精度和鲁棒性。实验表明该方法在合成和真实工业场景中均优于传统方法(GCC-PHAT/SRP-PHAT/MUSIC)和深度学习方法(CNN/CRNN/MTIT),为工业物联网应用提供了精度-效率-鲁棒性的最优平衡方案。
在智能制造和工业4.0时代,工业环境中充斥着各种设备运行声、流体泄漏声和异常噪声,这些声音蕴含着设备状态和位置的关键信息。声源定位(Sound Source Localization, SSL)技术因其高精度、低功耗、无需目标携带设备等优势,在工业噪声监测、设备故障诊断、流体泄漏检测和人机协作安全等领域具有广泛应用前景。然而,工业环境的复杂声学条件(如混响、噪声)和边缘设备的资源限制,给实际部署带来了巨大挑战。
传统模型基于方法如广义互相关相位变换(GCC-PHAT)、可控响应功率相位变换(SRP-PHAT)和多信号分类(MUSIC)算法虽然计算效率较高,但在复杂声学环境中性能严重下降。而基于深度学习的方法(如CNN、CRNN)虽然鲁棒性较好,但计算资源需求大,难以在资源受限的设备上实时运行。这种两难境地催生了对既能保持高精度又具备轻量级特性的新型SSL方法的迫切需求。
为解决这一难题,电子科技大学的研究团队在《Mechanical Systems and Signal Processing》上发表了一项创新研究,提出了潜在空间核自适应滤波(Latent Space Kernel Adaptive Filtering, LS-KAF)框架。该框架巧妙地将深度表示学习与核自适应滤波(Kernel Adaptive Filtering, KAF)相结合,通过编码器-滤波器-解码器的新范式,实现了工业声源定位技术的重大突破。
研究团队采用了三种核心技术:首先设计自适应编码器将高维音频特征映射到紧凑的潜在空间;其次开发轻量级核滤波器在潜在空间进行高效定位;最后引入重建解码器通过重构正则化保留关键空间信息。团队构建了LS-KLMS(随机梯度下降优化)、LS-KRLS(高精度计算)和LS-StKAF(学生核处理非线性)三种变体,在合成和真实工业场景中与GCC-PHAT、SRP-PHAT、MUSIC以及CNN、CRNN、MTIT等方法进行对比验证。
研究团队系统回顾了模型基于SSL方法、深度学习基于SSL方法以及核自适应滤波基于定位方法的发展现状。模型基于方法依赖物理或数学模型,在理想条件下可解释性强且计算高效,但在复杂声学环境中性能受限。深度学习基于方法通过数据驱动学习复杂声学模式,在恶劣条件下表现优异但计算需求大。核自适应滤波作为轻量级在线学习技术,在信号处理任务中展现出强大潜力,但直接应用于音频SSL时受限于特征高维性和冗余性问题。
The proposed Latent Space Kernel Adaptive Filtering for sound source localization
LS-KAF框架的核心创新在于将滤波过程从原始测量空间转移到由自适应编码器学习得到的紧凑、任务驱动的潜在空间。编码器负责将高维音频数据投影到潜在空间,核滤波器在该空间执行定位任务,重建解码器则通过辅助任务正则化潜在空间并保留空间关键特征。这种设计使得LS-KAF能够执行非线性、任务感知的建模,同时保持轻量级的在线自适应能力。
实验评估部分通过合成和真实工业场景的对比验证,全面考察了LS-KAF的定位精度和鲁棒性。在混响和噪声环境下的测试表明,LS-KAF变体在定位精度方面显著优于传统模型基于方法和深度学习基于方法。特别是在资源受限设备上的实时性能测试中,LS-KAF在保持高精度的同时实现了实时处理,证明了其在实际工业部署中的可行性。
LS-KAF框架通过将SSL问题分解为互补组件:深度表示映射提取任务相关特征,轻量级核滤波实现高效定位,重建解码器确保空间信息保留,成功解决了工业声源定位的核心挑战。该方法在模型基于方法的可解释性与深度学习基于方法的鲁棒性之间找到了最佳平衡点,为工业物联网环境中的实际部署提供了理想解决方案。
该研究的重要意义在于首次将潜在空间学习与核自适应滤波有机结合,为资源受限环境下的实时声源定位开辟了新途径。三种变体的设计满足了不同工业场景的精度-效率权衡需求,框架的灵活性也为其在其他传感模态的应用奠定了基础。随着工业物联网和边缘AI的快速发展,LS-KAF有望在智能制造、设备预测性维护等领域发挥重要作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号