AV HuBERT

使用场景研究人员使用AV-HuBERT框架进行音视觉语音识别的实验研究开发者利用AV-HuBERT模型开发能够理解不同语言环境下的语音识别应用教育工作者使用AV...

  • AV HuBERT

    类别:AI语音识别,AI音频增强器,音视觉处理,自监督学习,音视觉语音识别,普通产品,开源,
    官网:https://github.com/facebookresearch/av_hubert 更新时间:2025-08-01 17:18:08
  • 使用场景

    研究人员使用AV-HuBERT框架进行音视觉语音识别的实验研究

    开发者利用AV-HuBERT模型开发能够理解不同语言环境下的语音识别应用

    教育工作者使用AV-HuBERT辅助开发语言学习工具,提高学生的语言理解能力

    产品特色

    音视觉语音表示学习

    掩蔽多模态聚类预测

    自监督学习

    唇读、ASR和音视觉语音识别