
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于变分贝叶斯增强的深度稀疏展开网络实现高分辨率声源定位
【字体: 大 中 小 】 时间:2025年07月22日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
为解决传统声波束形成技术在低频域分辨率不足和模型稳定性差的问题,研究人员提出了一种融合变分贝叶斯增强机制( VBEM )的深度稀疏展开网络( LNVBENet )。通过自适应代理模型( APM )构建高质量数据集,结合Nesterov加速的迭代收缩阈值算法( LISTAN )和概率参数优化,显著提升了复杂声学环境下的定位精度与抗干扰能力。实验表明该方法在成像速度、稳定性及多源泛化性方面均超越现有技术,为机械故障诊断提供了新工具。
在工业设备健康监测领域,机械噪声如同设备的"健康密码",而声源定位技术就是破译这组密码的关键工具。传统声波束形成技术(Beamforming)虽广泛应用,却面临低频信号"视力模糊"的困境——当声波波长较长时,其方位分辨率会急剧下降,就像近视者看不清远处物体。更棘手的是,复杂工况下的干扰噪声常使现有算法"迷失方向",导致早期微弱故障难以被捕捉。这种技术瓶颈严重制约了风电轴承、高铁传动系统等关键设备的故障预警能力。
针对这一挑战,重庆交通大学的研究团队在《Engineering Applications of Artificial Intelligence》发表创新成果。他们巧妙地将深度学习"黑箱"与物理模型"白箱"嫁接,开发出LNVBENet网络。该技术通过三个核心技术突破:首先采用自适应代理模型(APM)生成不受频率影响的"声学地图";其次设计带Nesterov加速的迭代算法(LISTAN)提升求解效率;最后引入变分贝叶斯增强机制(VBEM)赋予模型"抗干扰基因"。这种"物理指导+数据驱动"的混合策略,使系统在保持可解释性的同时,实现了毫米级定位精度与实时成像的兼得。
关键技术包括:1)基于Pyroomacoustics和Acoular库构建多场景声学仿真数据集;2)将迭代收缩阈值算法(ISTA)展开为可训练网络层;3)通过证据下界(ELBO)构建包含能量损失与位置损失的复合目标函数;4)采用非均匀聚焦网格处理离轴声源。
【高分辨率目标地图构建】
APM模块突破传统波束形成器的衍射极限,在200Hz极低频段仍能保持0.1λ分辨率,相比传统DAMAS算法提升3倍。其核心是建立声压场与等效源强度的非线性映射,通过正则化约束消除"鬼影"伪影。
【网络架构设计】
LISTAN网络将迭代过程解构为可微分的近端梯度模块,引入动量项使收敛步数从50步缩减至15步。VBEM机制通过正态先验分布调整阈值参数,使800Hz频段的虚假峰值抑制比提升12dB。
【实验验证】
在压缩机站气体泄漏实验中,LNVBENet对0.5m间距的相干声源区分度达95%,而CLEAN-SC算法仅65%。更惊人的是,在信噪比-5dB的极端条件下,其定位误差仍控制在λ/20以内。
这项研究标志着声学诊断进入"高精度实时成像"时代。其创新性体现在三方面:物理约束的数据生成范式解决了深度学习对低频数据"饥渴症";概率增强机制使模型具备"环境自适应"能力;网络展开技术为其他逆问题提供可迁移框架。正如评审专家指出,该方法"重新定义了声学成像的性能边界",为智能运维装备研发提供了新范式。
生物通微信公众号
知名企业招聘