图像

图像

Microsoft Copilot For Mac

使用场景学生可以使用Copilot撰写论文大纲、润色文章，提升学习效率。设计师可以利用其图像生成功能快速创建设计草图和灵感图。职场人士可以借助Copilot撰写...

个人助理,写作助手,AI助手,生产力提升,创意激发,多语言支持,图像生成,普通产品 0 0
图像

Unitok

使用场景研究人员使用UniTok进行图像生成任务，以生成高质量的视觉内容。开发者利用UniTok构建多模态语言模型，用于视觉问答和图像分类。企业将UniTok集...

AI模型,图片生成,人工智能,视觉生成,视觉理解,多模态,图像处理,深度学习,普通产品,开源, 0 0
图像

Wan2gp

使用场景视频创作者可以使用 Wan2GP 快速生成创意视频，节省时间和成本。研究人员可以利用该模型进行视频生成相关的研究，探索新的应用场景。AI 爱好者可以在消...

视频生成,AI模型,视频生成,AI,低配置 GPU,多任务,文本到视频,图像到视频,普通产品,开源, 0 0
图像

Openart Characters

使用场景创作者可以快速生成角色用于故事创作或漫画绘制。设计师可以利用角色模板快速生成符合项目需求的角色形象。艺术家可以使用该平台探索不同风格的角色设计，激发灵感...

AI设计工具,图片生成,AI生成,角色创建,图像设计,创意工具,社区共享,普通产品 0 0
图像

Migician

使用场景在多图像场景中，用户可以通过自然语言指令让模型定位特定物体或区域，例如在一组图片中找到共同出现的人物。研究人员可以使用 Migician 的模型和数据集...

AI模型,图片生成,多模态,图像定位,自然语言处理,人工智能,开源,普通产品,开源, 0 0
图像

Photodoodle

使用场景使用 PhotoDoodle 将普通照片转换为带有魔法特效的艺术图像通过该模型为卡通角色添加怪物风格的艺术效果利用 PhotoDoodle 为手绘线条图...

AI设计工具,图片编辑,图像编辑,深度学习,少样本学习,艺术风格,特效,开源,普通产品,开源, 0 0
图像

M2RAG

使用场景研究人员可以使用M2RAG评估多模态大语言模型在图像描述任务中的性能。开发者可以利用M2RAG提供的代码和数据集，快速复现多模态检索增强生成的实验结果。...

AI模型,研究工具,多模态,检索增强生成,大语言模型,基准测试,图像,问答,事实验证,普通产品,开源, 0 0
图像

Phedra X

使用场景社交媒体创作者可以快速调整图片风格，使其更适合不同平台的视觉要求。电商设计师可以在几分钟内为产品图片更换背景，提升视觉效果。营销人员可以即时优化广告图片...

图片编辑,AI设计工具,AI技术,图像编辑,浏览器插件,设计工具,生产力工具,普通产品 0 0
图像

Olmocr 7B 0225 Preview

使用场景将扫描的学术论文图像转换为可编辑的纯文本，方便后续编辑和引用。从历史文献图像中提取文本内容，用于数字化保存和研究。处理企业合同图像，快速提取关键信息并生...

OCR,其他分类,文档识别,文本生成,图像处理,AI 模型,生产力工具,普通产品,开源, 0 0
图像

Magma 8B

使用场景在 UI 导航任务中，Magma-8B 能够根据图像输入生成正确的操作指令，如点击特定按钮。在机器人操作任务中，模型可以根据视频输入生成机械臂的操作路径...

AI模型,研究工具,多模态,AI,图像,文本生成,机器人操作,研究,普通产品,开源, 0 0
图像

Wan2.1 T2V 14B

使用场景根据输入的文本描述生成一段 5 秒的 480P 视频将静态图像转化为具有动态效果的视频结合文本提示生成包含中文或英文文字的视频内容产品特色支持文本到视频...

视频生成,AI模型,视频生成,文本到视频,图像到视频,多语言支持,高效压缩,开源模型,普通产品,开源, 0 0
图像

Siglip2

使用场景研究人员使用 SigLIP2 对多语言图像数据集进行分类研究开发者在电商平台上利用 SigLIP2 实现商品图像的自动分类企业用户通过 SigLIP2 ...

AI模型,图片分类,多语言,零样本分类,视觉语言模型,图像分类,语义理解,普通产品,开源, 0 0
图像

VLM R1

使用场景在自动驾驶场景中，VLM-R1 可以用于理解交通标志和道路状况的描述。在智能客服中，该模型可以解析用户对商品图片的描述，提供精准的客服支持。在图像标注任...

AI模型,图片编辑,视觉语言模型,强化学习,图像理解,深度学习,自然语言处理,普通产品,开源, 0 0
图像

Paligemma 2 Mix

使用场景使用 PaliGemma 2 mix 为短视频生成精准字幕，提升内容可读性。通过图像问答功能，帮助用户快速获取图像中的关键信息。在医学图像分析中，利用分...

AI模型,开发与工具,AI,图像识别,语言模型,多任务,高性能,国外精选 0 0
图像

WHAM

使用场景使用WHAM生成《Bleeding Edge》游戏中的角色动作和场景。基于WHAM的模型推理，为游戏设计提供创意迭代支持。通过WHAM演示工具，实时展示...

游戏生成,AI模型,生成式AI,游戏开发,学术研究,图像生成,行为预测,普通产品,开源, 0 0
图像

Kimi Latest

使用场景在 ChatWise 应用中使用 kimi-latest 模型，为用户提供智能聊天体验。企业利用 kimi-latest 构建 AI 客服系统，提升客户...

AI模型,智能体,AI模型,智能助手,图像理解,大上下文,自动缓存,多功能支持,普通产品 0 0
图像

Imagetranslate.ai

使用场景跨境电商Luolink：使用ImageTranslate.AI快速翻译产品列表，保持布局的同时准确翻译专业术语，节省大量时间。全球性品牌Jenson：利...

翻译,图片编辑,AI翻译,图像翻译,多语言支持,全球化,电子商务,内容本地化,普通产品 0 0
图像

Visionagent

使用场景在图像中统计罐头数量生成代码以统计图像中的人数在视频中检测和跟踪人物产品特色支持生成代码以解决视觉任务支持多种LLM提供商，如Anthropic和Ope...

代码助手,AI设计工具,人工智能,视觉任务,代码生成,LLM,图像处理,视频处理,普通产品,开源, 0 0
图像

Light A Video

使用场景在影视后期制作中，快速调整视频的光照效果以匹配不同的场景需求为视频广告添加更具吸引力的光照效果，提升视觉冲击力在视频会议中实时调整光照，改善视频质量产品...

视频编辑,AI模型,视频重光照,AI 技术,图像处理,视频编辑,创意工具,普通产品,开源, 0 0
图像

Pippo

使用场景研究人员使用 Pippo 模型从单张照片生成高质量的多人视角视频，用于虚拟现实内容创作。影视制作团队利用 Pippo 生成高分辨率的虚拟角色视频，节省拍...

视频生成,AI模型,图像生成,多视角视频,扩散模型,计算机视觉,虚拟现实,普通产品,开源, 0 0

点击加载更多