使用场景
用于开发多语种的语音合成系统
作为训练数据集,提高语音识别算法的准确性
在教育领域,用于语言学习和语音教学
产品特色
提供超过101,000小时的六种语言高质量语音数据
包含中文、英文、日文、韩文、德文和法文的语音和文本转录
源自互联网上多样化的视频平台和播客,内容类型丰富
支持使用Emilia-Pipe开源预处理管道进行数据预处理
允许研究者下载原始音频文件并重建数据集
Emilia-Pipe支持自定义语音数据的预处理,以满足特定研究需求
使用教程
1. 访问Emilia数据集页面并同意使用条款
2. 下载所需的原始音频文件
3. 使用Emilia-Pipe预处理管道对数据进行预处理
4. 根据研究需求重建数据集
5. 利用预处理后的数据进行语音生成或其他相关研究
6. 在研究成果中引用Emilia数据集和Emilia-Pipe
