
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于层改进残差Unet++和Aquila黑寡妇优化算法的语音增强方法研究
【字体: 大 中 小 】 时间:2025年07月30日 来源:Network: Computation in Neural Systems 1.1
编辑推荐:
来自未知机构的研究人员针对语音增强技术面临的计算需求高、数据集要求严格等问题,开发了基于层改进残差Unet++(LMResUnet++)的轻量化深度学习模型。该研究通过短时傅里叶变换(STFT)将含噪语音转换为频谱图,采用空洞卷积层捕获多尺度特征,并创新性地引入Aquila黑寡妇优化算法(ABWO)进行超参数优化。实验表明,该模型在PESQ指标上较DeepUnet、MTCNN等现有方法提升1.90%-7.93%,为环境噪声下的语音信号处理提供了高效解决方案。
在语音增强领域,环境噪声的复杂性和计算资源的高需求始终是重大挑战。这项研究巧妙地将层改进残差Unet++(LMResUnet++)架构与创新的Aquila黑寡妇优化算法(ABWO)相结合,构建出轻量高效的解决方案。通过短时傅里叶变换(STFT)将含噪语音转换为时频表征后,采用具备空洞卷积层的LMResUnet++模型进行特征提取,这种设计无需增加训练参数即可捕获多尺度信息。ABWO算法的引入更是锦上添花,它能智能优化模型超参数,使系统性能达到最佳状态。最终经逆短时傅里叶变换(iSTFT)重构的语音信号,在PESQ客观评价指标上展现出显著优势,较ResUnet++等现有方法提升幅度高达7.93%。这项研究为复杂噪声环境下的语音信号处理提供了新的技术路径。
生物通微信公众号
知名企业招聘