多模态

开发

Amazon Nova

使用场景使用Amazon Nova Reel为虚构的盒装意大利面品牌创建视频广告。利用Amazon Nova Pro模型描述和理解足球比赛视频。通过Amazon...

AI模型,开发平台,AWS,人工智能,技术创新,机器学习,多模态,国外精选 08月02日 0 0
设计

Pi 智能演示文档

使用场景商务会议中使用Pi快速制作并分享市场分析报告。教育领域中，教师利用Pi制作互动式教学课件。企业内部培训中，使用Pi创建结构化的培训材料。产品特色- 丰富...

PPT演示幻灯片,AI设计工具,演示文档,设计,智能推荐,多模态,中文精选 08月02日 0 0
图像

Qwen2 VL 2B

使用场景- 利用Qwen2-VL-2B进行文档的视觉问答，提高信息检索的效率。- 将Qwen2-VL-2B集成到机器人中，使其能够根据视觉环境和指令执行任务。-...

AI模型,视频生成,视觉语言模型,多模态,图像理解,视频理解,文本生成,多语言支持,普通产品,开源, 08月02日 0 0
视频

Qwen2 VL 7B

使用场景案例一：使用Qwen2-VL-7B进行视频内容的自动摘要和问题回答。案例二：集成Qwen2-VL-7B到移动应用中，实现基于图像的搜索和推荐。案例三：利...

AI模型,视频生成,视觉语言模型,多模态,文本生成,视频理解,多语言支持,普通产品,开源, 08月02日 0 0
图像

Internvl2 5 78B

使用场景使用InternVL2_5-78B进行图像描述生成，将图像内容转化为文字描述。在多图像理解任务中，利用InternVL2_5-78B分析和比较不同图像之...

AI模型,多模态模型,多模态,大型语言模型,视觉感知,图像-文本转换,机器学习,普通产品,开源, 08月02日 0 0
图像

Internvl2 5 38B

使用场景用于图像和文本的联合理解任务，如图像描述生成。在视频内容分析中，用于理解视频内容并生成视频摘要。作为聊天机器人的底层技术，提供图像和文本交互的能力。产品...

AI模型,AI信息平台,多模态,大型语言模型,图像识别,视频分析,自然语言处理,普通产品,开源, 08月02日 0 0
创作

Internvl2 5 26B

使用场景使用InternVL2_5-26B进行图像描述和理解，提升图像检索系统的准确性。在视频内容分析中应用InternVL2_5-26B，实现视频内容的自动标...

AI模型,多模态模型,多模态,大型语言模型,视觉Transformer,预训练模型,Hugging Face,普通产品,开源, 08月02日 0 0
图像

Internvl2 5 8B

使用场景- 使用InternVL2_5-8B进行图像描述和图像问答。- 利用模型进行多语言的图像标注和分类。- 将模型应用于视频内容的理解和分析。产品特色- 动...

AI模型,多模态,多模态,大型语言模型,图像-文本-文本,Transformers,TensorBoard,Safetensors,多语言,普通产品,开源, 08月02日 0 0
图像

Internvit 6B 448px V2 5

使用场景案例一：使用InternViT-6B-448px-V2_5进行图像分类，识别图像中的主要对象。案例二：在多语言文档处理中，利用模型进行OCR数据的识别和...

AI模型,图片编辑,视觉模型,特征提取,多模态,OCR,图像识别,普通产品,开源, 08月02日 0 0
创作

Mammoth VL

使用场景研究人员使用MAmmoTH-VL数据集训练MLLMs，以提高模型在数学问题解答任务中的表现。教育工作者利用MAmmoTH-VL平台设计课程，帮助学生理解...

AI模型,研究工具,多模态,推理,指令调优,数据集,教育,研究,普通产品,开源, 08月02日 0 0

点击加载更多