针对复杂语言环境的中国语音增强与自适应识别技术
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Chinese Speech Enhancement and Adaptive Recognition Technology for Complex Language Environments
【字体:
大
中
小
】
时间:2025年11月10日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
本研究改进了传统理想二进制掩码(IBM)算法,提出自适应IBM算法,结合深度学习模型构建新语音识别系统。实验表明,改进算法在复杂噪声环境下PESQ评分达3.5596,优于未改进算法(1.9418),且在噪声强度系数>0.008时性能显著提升。
摘要
智能技术的发展也在相关的语音领域取得了快速进展。为了扩大语音识别系统的应用场景,研究人员对传统的语音增强算法(即理想二值掩码(IBM)算法)进行了改进,并将其与未经改进的IBM算法相结合,提出了自适应IBM算法。基于该算法,研究人员构建了一个新的语音识别系统。该系统使用FIR滤波器实现预加重处理,并采用Berouti频谱减法对语音进行预处理。语音增强模型采用深度学习网络模型构建。实验结果表明,在语音质量感知评估(PESQ)中,IBM算法的得分最高,为3.5596,其次是理想比率掩码(IRM)算法,得分为3.3429。当噪声强度系数大于0.008时,改进后的IBM算法表现出较好的性能;而当噪声强度系数大于0.08时,改进后IBM算法的平均得分为2.1079,未经改进的IBM算法的平均得分为1.9418。与原始系统相比,所提出的自适应IBM算法在复杂的语音环境中具有更高的性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号