Videochat_创作

Videochat

类别：聊天机器人,数字人,实时语音交互,数字人,自定义形象,音色克隆,低延迟,普通产品,开源,

官网:https://github.com/Henry-23/VideoChat 更新时间：2025-08-02 09:45:46
使用场景
在线客服，提供24小时客户咨询服务
虚拟主播，用于新闻播报和娱乐节目
教育领域，作为虚拟教师进行教学辅助
产品特色
支持端到端语音方案（GLM-4-Voice - THG）和级联方案（ASR-LLM-TTS-THG）
自定义数字人形象与音色，无需训练
支持音色克隆功能
首包延迟低至3秒
在线demo提供实时体验
技术选型包括ASR、LLM、MLLM、TTS和THG
提供本地部署指南和API-KEY配置
使用教程
1. 克隆项目代码到本地：使用git clone命令克隆项目代码
2. 环境配置：根据项目要求配置Ubuntu系统、Python版本和CUDA版本
3. 安装依赖：使用pip install命令安装requirements.txt中的依赖
4. 下载权重文件：根据指南下载所需的权重文件
5. 配置API-KEY：如果需要使用API服务，按照指南配置API-KEY
6. 启动服务：运行python app.py启动服务
7. 使用自定义数字人：根据指南添加自定义数字人形象和音色
8. 测试和优化：运行服务后进行测试，并根据需要进行优化

Videochat