语音识别

创作

Ultravox V0 4 1 Llama 3 1 70b

使用场景作为语音代理，处理用户的语音查询并提供文本回复。进行语音到语音的翻译，将一种语言的语音转换为另一种语言的语音输出。分析口语音频，提取关键信息并生成文本摘...

语音识别,文本生成,多模态,大型语言模型,知识蒸馏,普通产品,开源, 08月02日 0 0
创作

Ultravox V0 4 1 Mistral Nemo

使用场景- 作为语音代理，处理用户的语音指令。- 进行语音到语音的翻译，帮助跨语言沟通。- 分析语音音频，提取关键信息，用于安全监控或客户服务。产品特色- 语音...

语音识别,语音翻译,多模态模型,知识蒸馏,混合精度训练,普通产品,开源, 08月02日 0 0
创作

Whisper Ner V1

使用场景案例一：使用Whisper-NER对会议录音进行转录，并识别会议中提及的公司和地点。案例二：在安全监控系统中，使用Whisper-NER实时转录监控音频...

语音识别,实体识别,自动语音识别,命名实体识别,开放类型NER,普通产品,开源, 08月02日 0 0
开发

Coval

使用场景客户服务中心使用Coval测试AI代理，以提高客户满意度。技术支持团队利用Coval评估AI代理的性能，优化故障处理流程。在线零售商通过Coval模拟客...

开发与工具,AI模型,AI代理,测试,评估,语音识别,聊天机器人,普通产品 08月02日 0 0
开发

Clearervoice Studio

使用场景研究人员使用ClearerVoice-Studio进行语音分离研究。开发者将ClearVoice集成到他们的应用程序中，以提升语音识别的准确性。最终用户...

开发与工具,语音识别,语音处理,AI,开源,预训练模型,语音增强,语音分离,目标说话人提取,普通产品,开源, 08月02日 0 0
创作

Shortcut By Poised

使用场景Lauren Sypniewski, Head of Data Operations，认为Shortcut在会议、头脑风暴和口述记录中非常实用。Andr...

个人助理,语音识别,AI助手,语音识别,文本转换,工作效率,个性化,普通产品 08月02日 0 0
图像

Megrez 3B Omni

使用场景在智能客服系统中，通过Megrez-3B-Omni模型理解用户上传的图片和语音信息，提供更准确的服务。在教育领域，利用模型的多模态能力，开发辅助教学工具...

AI模型,多模态,全模态理解,图像识别,语音识别,自然语言处理,端侧部署,普通产品,开源, 08月02日 0 0
音频

Omniaudio 2.6B

使用场景- 语音问答：如何不用火种生火。- 语音对话：我今天工作不顺。- 创意内容生成：写一首关于秋天落叶的俳句。- 会议记录总结：能总结这次会议记录吗？- 改...

语音识别,文本转声音,音频处理,边缘计算,多模态模型,语音识别,自然语言处理,优质新品 08月02日 0 0
学习

Gemini 英语口语助手

使用场景学生使用Gemini 英语口语助手进行日常口语练习，提高发音准确性。英语教师在课堂上使用该工具，为学生提供即时的发音反馈。语言学习爱好者通过情景对话练习...

学习教育,语音识别,英语,发音纠正,AI,教育,实时反馈,普通产品,开源, 08月02日 0 0
开发

Moonshine Web

使用场景- 在线会议中实时生成会议记录。- 为视频内容自动生成字幕。- 在移动设备上实现语音命令控制。产品特色- 语音识别：使用Moonshine Base模型...

语音识别,开发与工具,语音识别,自动语音识别,ASR,Transformers.js,WebGPU,开源,普通产品,开源, 08月02日 0 0

点击加载更多