
近日,钉钉与通义实验室的语音团队联合宣布推出一款新一代的语音识别大模型 ——Fun-ASR。这款模型具有出色的语音识别能力,能够理解家装、畜牧等十大行业的专业术语,且支持根据企业需求进行专属模型定制训练。
Fun-ASR 是基于双方的深度合作而开发的,能够精准地转写各种语音信号,具备多行业术语识别、不同语言和口音的处理能力。此外,Fun-ASR 还能够结合上下文信息进行更准确的语音转录,充分满足企业在特定场景下的需求。为了提高使用的灵活性和针对性,Fun-ASR 允许企业根据自身的业务特点进行模型的定制训练,从而更好地适应各自的业务环境。
目前,Fun-ASR 已经成功集成到钉钉的多个功能模块中,包括会议字幕与同声传译、智能纪要和语音助手等。这一系列功能的推出,旨在为企业提供一个稳定、高效且易于扩展的语音识别基础,尤其适合对语境理解和识别准确率有较高要求的企业场景。
尽管 Fun-ASR 目前已经具备了相当强大的功能,但其潜力尚未被完全挖掘。未来,钉钉和通义实验室将继续在方言识别、噪声鲁棒性、多语种支持及企业深度定制等方面进行探索与升级。通过这些不断的努力,双方希望进一步提升语音转写的精准度和实用性,推动更多企业业务场景的智能化升级。
项目:https://github.com/modelscope/FunASR
划重点:
- 🎤 钉钉与通义实验室推出的 Fun-ASR 语音识别大模型能够理解多行业术语。
- 📊 Fun-ASR 已集成到钉钉的多种功能中,支持企业定制化训练。
- 🚀 双方未来将继续提升 Fun-ASR 在方言识别和噪声鲁棒性等方面的能力。