Videochat

使用场景在线客服,提供24小时客户咨询服务虚拟主播,用于新闻播报和娱乐节目教育领域,作为虚拟教师进行教学辅助产品特色支持端到端语音方案(GLM-4-Voice ...

  • Videochat

    类别:聊天机器人,数字人,实时语音交互,数字人,自定义形象,音色克隆,低延迟,普通产品,开源,
    官网:https://github.com/Henry-23/VideoChat 更新时间:2025-08-02 09:45:46
  • 使用场景

    在线客服,提供24小时客户咨询服务

    虚拟主播,用于新闻播报和娱乐节目

    教育领域,作为虚拟教师进行教学辅助

    产品特色

    支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)

    自定义数字人形象与音色,无需训练

    支持音色克隆功能

    首包延迟低至3秒

    在线demo提供实时体验

    技术选型包括ASR、LLM、MLLM、TTS和THG

    提供本地部署指南和API-KEY配置

    使用教程

    1. 克隆项目代码到本地:使用git clone命令克隆项目代码

    2. 环境配置:根据项目要求配置Ubuntu系统、Python版本和CUDA版本

    3. 安装依赖:使用pip install命令安装requirements.txt中的依赖

    4. 下载权重文件:根据指南下载所需的权重文件

    5. 配置API-KEY:如果需要使用API服务,按照指南配置API-KEY

    6. 启动服务:运行python app.py启动服务

    7. 使用自定义数字人:根据指南添加自定义数字人形象和音色

    8. 测试和优化:运行服务后进行测试,并根据需要进行优化