AI模型

开发

Doubao 1.5 Pro

使用场景在智能客服场景中，通过语音多模态能力实现自然流畅的语音交互，提升用户体验。在图像识别任务中，利用视觉多模态能力快速准确地识别和理解复杂图像内容。在编程辅...

AI模型,开发与工具,大语言模型,多模态,高效推理,动态调整,自主数据标注,中文精选 08月02日 0 0
创作

UI TARS

使用场景在软件测试中，UI-TARS 可以自动检测和修复 GUI 中的问题。在自动化办公场景中，UI-TARS 可以自动完成文档处理、数据输入等任务。在网页自动...

自动化工作流,AI模型,人工智能,自动化,GUI,多模态,推理,定位,跨平台,中文精选,开源, 08月02日 0 0
创作

UI TARS 7B SFT

使用场景在自动化测试场景中，UI-TARS 可以自动识别和操作界面元素，完成测试任务。在智能办公场景中，UI-TARS 可以根据用户的指令自动操作办公软件，提高...

自动化工作流,AI模型,多模态交互,自动化,视觉感知,语义理解,任务自动化,GUI交互,人工智能,普通产品,开源, 08月02日 0 0
学习

Confucius O1 14B

使用场景学生在解决复杂的数学问题时，使用该模型获取详细的解题思路和逐步解答过程，从而更好地理解问题。教师在备课时，利用模型生成多种解题方法，丰富教学内容，提高课...

学习教育,AI模型,AI模型,教育,推理,数学,轻量化,单GPU部署,普通产品,开源, 08月02日 0 0
图像

Videollama3

使用场景在视频内容分析中，用户可以上传视频并获取详细的自然语言描述，帮助快速理解视频内容。用于视觉问答任务，用户可以输入问题并结合视频或图像获取准确的答案。在多...

视频生成,AI模型,多模态,视频理解,图像理解,自然语言处理,深度学习,普通产品,开源, 08月02日 0 0
图像

Smolvlm 500M Instruct

使用场景在移动设备上快速生成图像描述，帮助用户理解图像内容。为图像识别应用提供视觉问答功能，增强用户体验。在嵌入式设备上实现简单的文本转录功能，用于图像中的文字...

AI模型,图片生成,多模态,图像描述,视觉问答,轻量级,开源,高效,普通产品,开源, 08月02日 0 0
图像

Smolvlm 256M Instruct

使用场景在图像问答应用中，用户上传一张图片并提出问题，模型可根据图片内容回答问题。用于社交媒体平台的图像字幕生成，自动为用户上传的图片生成吸引人的字幕。在教育领...

AI模型,图片生成,多模态,图像处理,文本生成,高效,轻量化,普通产品,开源, 08月02日 0 0
创作

Baichuan M1 14B

使用场景在临床实践中辅助医生进行病症判断和治疗方案推荐用于医学教育，帮助学生学习和理解复杂的医学知识支持医疗研究，通过文本生成和推理辅助医学论文撰写产品特色从零...

医疗,AI模型,大语言模型,医疗,开源,人工智能,自然语言处理,普通产品,开源, 08月02日 0 0
创作

Llasa 3B

使用场景为有声读物平台生成高质量的中文和英文语音内容开发支持多语言的语音助手应用，提供自然流畅的语音交互为在线教育平台生成课程语音讲解，提升用户体验产品特色支持...

文本转声音,AI模型,文本到语音,语音合成,中英文支持,开源模型,高质量语音,普通产品,开源, 08月02日 0 0
创作

Llasa 1B

使用场景为有声读物应用生成自然流畅的中文和英文语音内容。为智能语音助手提供高质量的语音合成能力。在教育软件中为学生朗读文本内容，辅助学习。产品特色支持中英文文本...

文本转声音,AI模型,文本转语音,语音合成,人工智能,中英文支持,开源模型,普通产品,开源, 08月02日 0 0

点击加载更多