Seed Tts Eval

使用场景研究者使用seed-tts-eval评估新的语音合成模型的性能开发者利用该测试集比较不同语音合成技术的效果教育机构使用该测试集作为教学材料,教授语音合成...

  • Seed Tts Eval

    类别:AI模型,AI语音合成,语音合成,自动语音识别,说话人相似度,普通产品,开源,
    官网:https://github.com/BytedanceSpeech/seed-tts-eval/ 更新时间:2025-08-01 18:16:33
  • 使用场景

    研究者使用seed-tts-eval评估新的语音合成模型的性能

    开发者利用该测试集比较不同语音合成技术的效果

    教育机构使用该测试集作为教学材料,教授语音合成技术

    产品特色

    采用Common Voice和DiDiSpeech-2数据集样本进行评估

    使用Word Error Rate (WER)和Speaker Similarity (SIM)作为评估指标

    为英语和普通话分别采用Whisper-large-v3和Paraformer-zh作为自动语音识别引擎

    使用WavLM-large模型进行说话人相似度评估

    提供测试集的下载链接

    支持零样本文本到语音(TTS)和声音转换(VC)任务的评估

    使用教程

    访问seed-tts-eval的GitHub页面

    阅读README文件了解如何安装依赖和使用测试集

    下载所需的测试集样本

    使用提供的评估代码进行模型性能的评估

    根据评估结果优化语音合成模型