使用场景
用户A想要生成一个具有美国口音的女性声音进行播报
用户B需要一个带有英国口音的男性声音进行录音
用户C想要一个带有南非口音的男性声音进行播报
产品特色
通过自然语言指导实现高保真文本转语音
标注不同的说话者身份、风格和录音条件
提供45000小时的数据集进行训练
提出简单方法提高音频保真度
使用场景
用户A想要生成一个具有美国口音的女性声音进行播报
用户B需要一个带有英国口音的男性声音进行录音
用户C想要一个带有南非口音的男性声音进行播报
产品特色
通过自然语言指导实现高保真文本转语音
标注不同的说话者身份、风格和录音条件
提供45000小时的数据集进行训练
提出简单方法提高音频保真度