
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向包容性教育的低资源混合语音克隆技术:数据高效与实时合成的突破
【字体: 大 中 小 】 时间:2025年10月10日 来源:Frontiers in Computer Science 2.7
编辑推荐:
本综述提出了一种适用于低资源教育环境的混合语音克隆系统,该系统结合GE2E说话人编码器、Tacotron合成器与改进型WaveRNN声码器,仅需5–10秒目标语音即可实现高质量个性化语音合成。研究在LibriSpeech、VCTK及含噪数据集上取得MCD≈4.8–5.1、MOS达3.8–4.7的优异表现,EER<12%,显著提升语音自然度与说话人相似性。该系统为特殊教育、多语言课堂及辅助技术提供了数据高效、计算友好且符合伦理(水印与检测机制)的解决方案。
生物通微信公众号
知名企业招聘