利用深度学习算法进行低资源语言分析以实现性别分类

《ACM Transactions on Asian and Low-Resource Language Information Processing》:Low Resource Language Analysis Using Deep Learning Algorithm for Gender Classification

【字体: 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  本文利用MFCC特征和RNN-BiLSTM算法对印地语跨性别者语音信号进行性别识别研究,通过活体语音样本测试,男、女、跨性别识别准确率分别为91.44%、94.94%、96.11%,结果显示跨性别识别性能最优,平均准确率达94.16%,验证了算法在低资源数据下的有效性。

  

摘要

语音信号是基于人机交互技术的应用中最重要的输入来源。通过语音信号进行性别识别是一项极具挑战性的任务。对于基于语音信号的分析,深度学习算法为传统的分类算法提供了一种替代方案。为了识别女性、男性和“初次”跨性别者的性别,本文采用深度学习算法,并利用梅尔频率倒谱系数(MFCC)作为语音信号的特征,以提高识别模型的鲁棒性。本文通过录制的实时语音信号展示了性别识别的准确性。第三性别的语音样本是用印地语录制的,这类印地语语音样本资源非常稀缺,且在任何公认的资料库中都难以找到。模拟结果不依赖于信号的长度,也与文本内容无关。在录制的语音信号上应用了循环神经网络——双向长短期记忆(RNN-BiLSTM)算法,并将模拟结果与文献中已有的研究结果进行了比较。使用语音信号,该模型在男性、女性和跨性别者性别识别方面的平均准确率分别为91.44%、94.94%和96.11%。与其他性别相比,跨性别者的性别识别准确率较高;而该模型的整体平均准确率为94.16%。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号