Emilia

使用场景用于开发多语种的语音合成系统作为训练数据集,提高语音识别算法的准确性在教育领域,用于语言学习和语音教学产品特色提供超过101,000小时的六种语言高质量...

  • Emilia

    类别:AI语音识别,AI数据挖掘,语音数据集,多语种,高质量,开源,普通产品,开源,
    官网:https://huggingface.co/datasets/amphion/Emilia 更新时间:2025-08-01 18:34:28
  • 使用场景

    用于开发多语种的语音合成系统

    作为训练数据集,提高语音识别算法的准确性

    在教育领域,用于语言学习和语音教学

    产品特色

    提供超过101,000小时的六种语言高质量语音数据

    包含中文、英文、日文、韩文、德文和法文的语音和文本转录

    源自互联网上多样化的视频平台和播客,内容类型丰富

    支持使用Emilia-Pipe开源预处理管道进行数据预处理

    允许研究者下载原始音频文件并重建数据集

    Emilia-Pipe支持自定义语音数据的预处理,以满足特定研究需求

    使用教程

    1. 访问Emilia数据集页面并同意使用条款

    2. 下载所需的原始音频文件

    3. 使用Emilia-Pipe预处理管道对数据进行预处理

    4. 根据研究需求重建数据集

    5. 利用预处理后的数据进行语音生成或其他相关研究

    6. 在研究成果中引用Emilia数据集和Emilia-Pipe