Dia AI_创作_未来号

Dia AI

类别：文本转声音,AI模型,文本到语音,AI,对话生成,声音克隆,开源,国外精选,开源,

官网:https://github.com/nari-labs/dia 更新时间：2025-08-02 10:44:30
使用场景
生成虚拟助手的对话内容。
为游戏角色创建多样化的声音。
制作教育视频中的语音解说。
产品特色
生成对话，通过 [S1] 和 [S2] 标签区分说话者。
生成非言语交流，如（笑）、（咳嗽）等。
语音克隆功能，可以上传音频进行克隆。
可通过 Gradio UI 进行操作，便于用户交互。
提供预训练模型和推理代码，促进研究。
支持通过音频条件化输出，以控制情感和语调。
支持生成多种声音，保持说话者一致性。
在企业级 GPU 上可以实时生成音频。
使用教程
1. 从 GitHub 克隆代码库：git clone https://github.com/nari-labs/dia.git
2. 进入目录：cd dia
3. 安装依赖：pip install -e .
4. 启动 Gradio UI：python app.py
5. 在 UI 中输入文本并生成音频。

Dia AI