Dia AI

使用场景生成虚拟助手的对话内容。为游戏角色创建多样化的声音。制作教育视频中的语音解说。产品特色生成对话,通过 [S1] 和 [S2] 标签区分说话者。生成非言语...

  • Dia AI

    类别:文本转声音,AI模型,文本到语音,AI,对话生成,声音克隆,开源,国外精选,开源,
    官网:https://github.com/nari-labs/dia 更新时间:2025-08-02 10:44:30
  • 使用场景

    生成虚拟助手的对话内容。

    为游戏角色创建多样化的声音。

    制作教育视频中的语音解说。

    产品特色

    生成对话,通过 [S1] 和 [S2] 标签区分说话者。

    生成非言语交流,如(笑)、(咳嗽)等。

    语音克隆功能,可以上传音频进行克隆。

    可通过 Gradio UI 进行操作,便于用户交互。

    提供预训练模型和推理代码,促进研究。

    支持通过音频条件化输出,以控制情感和语调。

    支持生成多种声音,保持说话者一致性。

    在企业级 GPU 上可以实时生成音频。

    使用教程

    1. 从 GitHub 克隆代码库:git clone https://github.com/nari-labs/dia.git

    2. 进入目录:cd dia

    3. 安装依赖:pip install -e .

    4. 启动 Gradio UI:python app.py

    5. 在 UI 中输入文本并生成音频。