使用场景
会议记录:快速准确地将会议语音内容转录为文字,方便后续整理和分享。
视频字幕制作:为电影、视频等生成精准的字幕,支持多语言。
内容创作:帮助创作者将音频内容(如播客、歌曲歌词)快速转录为文本,提升创作效率。
产品特色
支持99种语言的高精度语音转文字
提供单词级时间戳,方便精确编辑和同步
说话人分离功能,可区分不同说话者
音频事件标记(如笑声、掌声等非语音事件)
低延迟版本即将推出,适用于实时应用
使用教程
1. 注册并登录 ElevenLabs 官方网站。
2. 通过 ElevenLabs 仪表盘上传音频或视频文件。
3. 选择 Scribe 模型进行语音转文字处理。
4. 下载或直接使用生成的结构化文本转录结果。
5. 开发者可通过 API 文档集成 Scribe 至自己的应用程序。