多模态

  • Amazon Nova

    使用场景使用Amazon Nova Reel为虚构的盒装意大利面品牌创建视频广告。利用Amazon Nova Pro模型描述和理解足球比赛视频。通过Amazon...
    AI模型,开发平台,AWS,人工智能,技术创新,机器学习,多模态,国外精选 08月02日 0 0
  • Pi 智能演示文档

    使用场景商务会议中使用Pi快速制作并分享市场分析报告。教育领域中,教师利用Pi制作互动式教学课件。企业内部培训中,使用Pi创建结构化的培训材料。产品特色- 丰富...
    PPT演示幻灯片,AI设计工具,演示文档,设计,智能推荐,多模态,中文精选 08月02日 0 0
  • Qwen2 VL 2B

    使用场景- 利用Qwen2-VL-2B进行文档的视觉问答,提高信息检索的效率。- 将Qwen2-VL-2B集成到机器人中,使其能够根据视觉环境和指令执行任务。-...
    AI模型,视频生成,视觉语言模型,多模态,图像理解,视频理解,文本生成,多语言支持,普通产品,开源, 08月02日 0 0
  • Qwen2 VL 7B

    使用场景案例一:使用Qwen2-VL-7B进行视频内容的自动摘要和问题回答。案例二:集成Qwen2-VL-7B到移动应用中,实现基于图像的搜索和推荐。案例三:利...
    AI模型,视频生成,视觉语言模型,多模态,文本生成,视频理解,多语言支持,普通产品,开源, 08月02日 0 0
  • Internvl2 5 78B

    使用场景使用InternVL2_5-78B进行图像描述生成,将图像内容转化为文字描述。在多图像理解任务中,利用InternVL2_5-78B分析和比较不同图像之...
    AI模型,多模态模型,多模态,大型语言模型,视觉感知,图像-文本转换,机器学习,普通产品,开源, 08月02日 0 0
  • Internvl2 5 38B

    使用场景用于图像和文本的联合理解任务,如图像描述生成。在视频内容分析中,用于理解视频内容并生成视频摘要。作为聊天机器人的底层技术,提供图像和文本交互的能力。产品...
    AI模型,AI信息平台,多模态,大型语言模型,图像识别,视频分析,自然语言处理,普通产品,开源, 08月02日 0 0
  • Internvl2 5 26B

    使用场景使用InternVL2_5-26B进行图像描述和理解,提升图像检索系统的准确性。在视频内容分析中应用InternVL2_5-26B,实现视频内容的自动标...
    AI模型,多模态模型,多模态,大型语言模型,视觉Transformer,预训练模型,Hugging Face,普通产品,开源, 08月02日 0 0
  • Internvl2 5 8B

    使用场景- 使用InternVL2_5-8B进行图像描述和图像问答。- 利用模型进行多语言的图像标注和分类。- 将模型应用于视频内容的理解和分析。产品特色- 动...
    AI模型,多模态,多模态,大型语言模型,图像-文本-文本,Transformers,TensorBoard,Safetensors,多语言,普通产品,开源, 08月02日 0 0
  • Internvit 6B 448px V2 5

    使用场景案例一:使用InternViT-6B-448px-V2_5进行图像分类,识别图像中的主要对象。案例二:在多语言文档处理中,利用模型进行OCR数据的识别和...
    AI模型,图片编辑,视觉模型,特征提取,多模态,OCR,图像识别,普通产品,开源, 08月02日 0 0
  • Mammoth VL

    使用场景研究人员使用MAmmoTH-VL数据集训练MLLMs,以提高模型在数学问题解答任务中的表现。教育工作者利用MAmmoTH-VL平台设计课程,帮助学生理解...
    AI模型,研究工具,多模态,推理,指令调优,数据集,教育,研究,普通产品,开源, 08月02日 0 0