Omnisensevoice_创作

Omnisensevoice

类别：AI语音识别,AI语音转文本,语音识别,时间戳,多语言支持,GPU加速,开源,普通产品,开源,

官网:https://github.com/lifeiteng/OmniSenseVoice 更新时间：2025-08-01 19:13:15
使用场景
会议实时语音转录，生成带有时间戳的会议记录。
在线课程内容转写，为学生提供带有时间戳的课程笔记。
实时翻译应用，提供快速准确的语音翻译服务。
产品特色
支持多种语言自动检测或指定（自动、中文、英文、粤语、日语、韩语）。
提供文本归一化选项，可以选择是否进行逆文本归一化处理。
可以选择在特定的GPU上运行，默认为CPU。
使用量化模型以加快处理速度。
提供详细的帮助信息，便于用户理解和使用。
基准测试功能，可以评估模型性能。
支持高达50倍的快速处理，同时不牺牲准确性。
使用教程
1. 安装OmniSenseVoice模型。
2. 根据需要设置语言参数，例如：--language zh。
3. 选择是否进行文本归一化处理，例如：--textnorm woitn。
4. 指定运行的设备ID，例如：--device-id 0。
5. 如果需要，可以选择使用量化模型，例如：--quantize。
6. 运行基准测试，评估模型性能，例如：omnisense benchmark -s -d --num-workers 2 --device-id 0 --batch-size 10 --textnorm woitn --language en benchmark/data/manifests/libritts/libritts_cuts_dev-clean.jsonl。
7. 查看README文件，了解更多使用细节和配置选项。
8. 根据具体需求调整参数，进行语音识别任务。

点击加载更多

Omnisensevoice

Omnisensevoice

精彩推荐

马斯克宣布旗下xAI开源Grok 2.5模型 Grok 3半年后跟进

AI医疗与创新药齐热，京东健康在押什么注？

即梦AI智能多帧功能：开启视频创作新时代

这群年轻人用“AI”种菜

马斯克旗下xAI宣布Grok 4 AI模型永久免费开放

猜你喜欢

人形机器人「朋友圈」的明牌和暗战

宇树科技专利侵权案一审判决：未构成侵权，原告败诉

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 | 涌现NewThings

刚刚，OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

字节信徒MiniMax

看360 - 吹响未来的号角！

Omnisensevoice

Omnisensevoice

精彩推荐

马斯克宣布旗下xAI开源Grok 2.5模型 Grok 3半年后跟进

AI医疗与创新药齐热，京东健康在押什么注？

即梦AI智能多帧功能：开启视频创作新时代

这群年轻人用“AI”种菜

马斯克​旗下xAI宣布Grok 4 AI模型永久免费开放

猜你喜欢

人形机器人「朋友圈」的明牌和暗战

宇树科技专利侵权案一审判决：未构成侵权，原告败诉

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 | 涌现NewThings

刚刚，OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

字节信徒MiniMax

看360 - 吹响未来的号角！

马斯克旗下xAI宣布Grok 4 AI模型永久免费开放