AI模型 多模态 语音识别 视觉问答 多语言 优质新品 开源
使用场景作为语音助手,为用户提供多语言语音翻译和语音问答服务在教育领域,通过视觉和语音输入辅助学生学习数学和科学知识用于内容创作,根据图像或音频输入生成相关的文...