利用深度学习算法进行低资源语言分析以实现性别分类
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Low Resource Language Analysis Using Deep Learning Algorithm for Gender Classification
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
本文利用MFCC特征和RNN-BiLSTM算法对印地语跨性别者语音信号进行性别识别研究,通过活体语音样本测试,男、女、跨性别识别准确率分别为91.44%、94.94%、96.11%,结果显示跨性别识别性能最优,平均准确率达94.16%,验证了算法在低资源数据下的有效性。
摘要
语音信号是基于人机交互技术的应用中最重要的输入来源。通过语音信号进行性别识别是一项极具挑战性的任务。对于基于语音信号的分析,深度学习算法为传统的分类算法提供了一种替代方案。为了识别女性、男性和“初次”跨性别者的性别,本文采用深度学习算法,并利用梅尔频率倒谱系数(MFCC)作为语音信号的特征,以提高识别模型的鲁棒性。本文通过录制的实时语音信号展示了性别识别的准确性。第三性别的语音样本是用印地语录制的,这类印地语语音样本资源非常稀缺,且在任何公认的资料库中都难以找到。模拟结果不依赖于信号的长度,也与文本内容无关。在录制的语音信号上应用了循环神经网络——双向长短期记忆(RNN-BiLSTM)算法,并将模拟结果与文献中已有的研究结果进行了比较。使用语音信号,该模型在男性、女性和跨性别者性别识别方面的平均准确率分别为91.44%、94.94%和96.11%。与其他性别相比,跨性别者的性别识别准确率较高;而该模型的整体平均准确率为94.16%。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号