使用场景将物体堆叠在桌子中央将水果放入顶层抽屉将积木按颜色分组产品特色训练视觉语言模型和文本到视频模型生成详细的多模态规划合成长期视频规划转化为真实机器人动作
AI开发助手,AI模型,视觉规划,多模态,机器人,普通产品,开源,
08月01日
0
使用场景生成coco风格的字幕回答关于图像的问题回答关于图表的问题产品特色支持图像和文本生成支持任意图像分辨率回答关于图表和图形的问题回答基于UI的问题对屏幕图...
AI模型,AI图像生成,多模态,图像生成,文本生成,普通产品,开源,
08月01日
0
使用场景企业客服中心使用对话机器人智能坐席助理提升客服效率销售团队使用对话机器人智能坐席助理提供实时业务指引公司使用多模态智能联络中心实现全渠道客户服务产品特色...
AI客户服务助手,AI聊天机器人,智能坐席助理,多模态,智能联络中心,企业智能服务,对话机器人,普通产品
08月01日
0
产品特色3D视觉语言对齐3D视觉语言动作指令调整3D字幕问答推理导航机器人操作
AI Agents,AI模型,人工智能,3D世界,多模态,多任务,视觉语言对齐,视觉语言动作指令调整,普通产品,开源,
08月01日
0
产品特色多模态多视角视频数据集同步的自我中心和外部中心视图多种感知模态,包括麦克风、IMUs、气压计等三种自然语言数据集支持研究日常生活活动的多模态机器感知
研究工具,数据集,多模态,多视角,视频数据集,机器感知,普通产品
08月01日
0
使用场景通过文本和图像提示Gemini玩石头剪刀布游戏让Gemini根据绘画描述生成音乐搜索查询用图像序列提示Gemini猜电影名称产品特色图像描述视觉推理多模...
AI模型,AI内容生成,Gemini,多模态,Generative AI,普通产品
08月01日
0
产品特色多模态推理支持文本、图像、视频、音频和代码生成代码多种语言理解任务
AI模型,AI内容生成,AI,多模态,推理,编程,普通产品
08月01日
0
产品特色多模态能力优化的性能可扩展和高效的解决方案强调责任和安全性
AI模型,人工智能,模型,多模态,性能优化,责任与安全,普通产品
08月01日
0
使用场景在图像标注任务中,使用OneLLM统一处理图像和文本数据。在视频描述生成中,利用OneLLM统一处理视频和文本信息。在语音识别和文本处理中,使用OneL...
AI模型,AI开发助手,多模态,图像处理,文本处理,普通产品,开源,
08月01日
0
使用场景生成有趣的文本回复为图片生成搞笑标题进行创意思维训练活动产品特色基于 Oogiri 游戏的创意幽默生成处理多模态信息探索语言模型的创意潜力
AI聊天机器人,AI内容生成,创意,幽默,多模态,Oogiri,语言模型,普通产品,开源,
08月01日
0