使用场景
为视频游戏角色提供逼真的语音。
在教育软件中为不同语言的学习者生成教学内容。
为商业广告制作多语言版本的旁白。
产品特色
更优的音质:采用新的训练策略,提供更高质量的音频输出。
原生多语言支持:支持英语、西班牙语、法语、中文、日语和韩语。
商业用途免费:自2024年4月起,V2和V1都根据MIT许可证发布,允许商业用途的免费使用。
音调色彩克隆:能够精确克隆参考音调色彩。
声音风格控制:可以精细控制声音风格,包括情感和口音,以及其他风格参数如节奏、停顿和语调。
零样本跨语言克隆:无需在训练数据集中呈现生成语音或参考语音的语言。
灵活的安装选项:提供Linux安装指南,适用于研究人员和开发者。
使用教程
步骤1:访问OpenVoice V2的产品页面。
步骤2:根据需要选择快速使用或下载安装。
步骤3:如果选择快速使用,尝试已部署的服务,如英式英语、美式英语等。
步骤4:如果选择Linux安装,克隆仓库并按照指南运行安装。
步骤5:下载并解压对应版本的检查点文件到指定的文件夹。
步骤6:根据提供的demo_part*.ipynb文件进行示例使用,了解如何控制声音风格。
步骤7:如果需要跨语言语音克隆,参考demo_part2.ipynb中的示例。
步骤8:对于本地演示,可以使用提供的Gradio演示启动本地演示。