针对复杂语言环境的中国语音增强与自适应识别技术

《ACM Transactions on Asian and Low-Resource Language Information Processing》:Chinese Speech Enhancement and Adaptive Recognition Technology for Complex Language Environments

【字体: 时间:2025年11月10日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  本研究改进了传统理想二进制掩码(IBM)算法,提出自适应IBM算法,结合深度学习模型构建新语音识别系统。实验表明,改进算法在复杂噪声环境下PESQ评分达3.5596,优于未改进算法(1.9418),且在噪声强度系数>0.008时性能显著提升。

  

摘要

智能技术的发展也在相关的语音领域取得了快速进展。为了扩大语音识别系统的应用场景,研究人员对传统的语音增强算法(即理想二值掩码(IBM)算法)进行了改进,并将其与未经改进的IBM算法相结合,提出了自适应IBM算法。基于该算法,研究人员构建了一个新的语音识别系统。该系统使用FIR滤波器实现预加重处理,并采用Berouti频谱减法对语音进行预处理。语音增强模型采用深度学习网络模型构建。实验结果表明,在语音质量感知评估(PESQ)中,IBM算法的得分最高,为3.5596,其次是理想比率掩码(IRM)算法,得分为3.3429。当噪声强度系数大于0.008时,改进后的IBM算法表现出较好的性能;而当噪声强度系数大于0.08时,改进后IBM算法的平均得分为2.1079,未经改进的IBM算法的平均得分为1.9418。与原始系统相比,所提出的自适应IBM算法在复杂的语音环境中具有更高的性能。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号