Reverb

使用场景用于会议记录的自动语音识别和说话人分割电话客服录音的语音内容分析法庭记录的语音转写和说话人识别产品特色基于 WeNet 框架的语音识别代码基于 Pyan...

  • Reverb

    类别:AI语音识别,AI语音合成,语音识别,说话人分割,WeNet,Pyannote,开源,Hugging Face,普通产品,开源,
    官网:https://github.com/revdotcom/reverb 更新时间:2025-08-02 09:26:06
  • 使用场景

    用于会议记录的自动语音识别和说话人分割

    电话客服录音的语音内容分析

    法庭记录的语音转写和说话人识别

    产品特色

    基于 WeNet 框架的语音识别代码

    基于 Pyannote 框架的说话人分割代码

    提供长形式语音识别和说话人分割的WER和WDER结果

    支持通过 Hugging Face Hub 下载模型

    提供 Docker 镜像以简化部署

    支持在 NVIDIA GPU 上运行以提高性能

    提供详细的安装和使用说明

    使用教程

    1. 确保系统中已安装 Git Large File Storage (LFS)。

    2. 使用 HUGGINGFACE_ACCESS_TOKEN 从 Hugging Face Hub 下载模型。

    3. 克隆 Reverb 代码库到本地。

    4. 设置虚拟环境并激活。

    5. 在代码库根目录下,设置环境变量以包含 ASR 目录。

    6. 使用 Docker 构建镜像(如果需要)。

    7. 运行 Docker 容器(如果使用 Docker 部署)。

    8. 按照 README.md 中的说明进行模型推理和评估。