多模态

创作

Gpt4o (Omni)

使用场景将文本转换为音频生成图像描述音频合成产品特色处理文本、视觉和音频可以生成多种主要模态的输出具备较快的响应时间支持生成3D图像成本效益高使用教程访问GPT...

AI模型,AI内容生成,多模态,人工智能,语音助手,普通产品 08月01日 0 0
图像

Cogvlm2

使用场景用于开发智能客服系统，提高客户服务效率在教育领域，辅助教学，提供图像和文本的交互式学习体验在医疗领域，辅助医生进行病例分析和图像识别产品特色支持多种基准...

AI模型,AI聊天机器人,多模态,预训练模型,对话系统,图像理解,普通产品,开源, 08月01日 0 0
创作

Minicpm Llama3 V 2.5

使用场景在智能手机上进行图像和文本的多模态交互。使用模型进行场景文字识别和信息提取。跨语言的多模态对话和内容生成。产品特色领先的性能：在OpenCompass榜...

AI模型,AI模型推理训练,多模态,端侧部署,多语言支持,OCR,高性能,普通产品,开源, 08月01日 0 0
图像

Phi 3 Vision 128k Instruct

使用场景用于教育领域，帮助学生理解复杂概念。在商业环境中，用于图像和文本数据的分析和处理。在研究中，作为生成AI功能的强大基础模型。产品特色4.2B参数，包含图...

AI模型,AI图像生成,多模态,高质量,推理,视觉,文本,优质新品 08月01日 0 0
开发

Cantor

使用场景教育工作者使用Cantor分析科学问题，提高教学内容的准确性研究人员利用Cantor的多模态CoT框架，解决视觉推理领域的难题学生通过Cantor学习如...

AI模型,AI开发平台,多模态,视觉推理,大型语言模型,教育,研究,优质新品,开源, 08月01日 0 0
学习

Opencompass Multi Modal Leaderboard

使用场景研究人员使用排行榜来比较不同模型在特定任务上的表现开发者利用排行榜数据来选择适合其应用场景的模型企业决策者参考排行榜来制定技术采购或研发策略产品特色提供...

AI信息平台,研究工具,多模态,性能评估,排行榜,人工智能,机器学习,普通产品 08月01日 0 0
视频

Video MME

使用场景Gemini 1.5 Pro在不同视频长度和子类别中的准确度评分GPT-4o和GPT-4V在视频分析任务中的表现对比LLaVA-NeXT-Video模型...

AI视频分析,AI模型评测,多模态,视频分析,性能评估,人工智能,普通产品,开源, 08月01日 0 0
创作

GLM 4系列

使用场景使用GLM-4-9B-Chat进行跨语言的聊天机器人开发。利用GLM-4V-9B进行图像和文本结合的多模态数据分析。通过GLM-4系列模型进行大规模语料...

AI模型,AI内容生成,多语言,多模态,对话模型,预训练模型,自然语言处理,编辑推荐,开源, 08月01日 0 0
创作

GLM 4V 9B

使用场景用于生成描述图片内容的文本在多语言环境下进行自然语言处理任务作为聊天机器人的底层模型，提供智能对话服务产品特色支持8K上下文长度的模型仓库具备视觉理解能...

AI模型,AI聊天机器人,多模态,预训练模型,中英双语,视觉理解,对话生成,国外精选,开源, 08月01日 0 0
创作

Qmedia

使用场景内容创作者 Alice 使用 Qmedia 快速搜索到所需的素材，提升了文章撰写效率。设计师 Bob 利用 Qmedia 搜索到灵感来源，加速了作品创作...

AI搜索引擎,AI内容生成,内容创作,AI 搜索引擎,多模态,普通产品,开源, 08月01日 0 0

点击加载更多