多模态

  • Realtime API

    使用场景Healthify应用使用Realtime API与AI教练Ria进行自然对话Speak语言学习应用使用Realtime API进行角色扮演练习客户支持...
    AI语音识别,AI语音合成,语音交互,低延迟,多模态,WebSocket,GPT-4o,国外精选 08月02日 0 0
  • VARAG

    使用场景法律团队使用VARAG快速检索合同文档中的相关条款。研究人员利用VARAG从大量学术论文中提取关键信息。商业分析师使用VARAG分析市场报告中的图表和数...
    AI搜索引擎,AI数据挖掘,检索,生成,OCR,多模态,文档处理,普通产品,开源, 08月02日 0 0
  • NVLM D 72B

    使用场景研究人员使用NVLM-D-72B进行图像描述生成实验。数据科学家利用该模型进行视觉问答系统开发。机器学习工程师将模型集成到多模态对话系统中。产品特色支持...
    AI模型,AI图像生成,AI,多模态,大型语言模型,普通产品,开源, 08月02日 0 0
  • NVLM 1.0

    使用场景用于图像描述生成,提高图像内容理解的准确性。在数学和编程问题解答中,提供逐步的数学推理。用于OCR任务,识别图像中的文本并进行处理。产品特色在视觉-语言...
    AI模型,AI模型推理训练,多模态,大型语言模型,开源,视觉-语言任务,普通产品 08月02日 0 0
  • Unimumo

    使用场景音乐制作人利用UniMuMo根据文本描述生成音乐和舞蹈动作。视频游戏开发者使用UniMuMo为游戏中的NPC生成同步的音乐和动作。虚拟现实内容创作者使用...
    AI模型,AI内容生成,人工智能,机器学习,多模态,音乐生成,动作生成,普通产品,开源, 08月02日 0 0
  • ACE: All Round Creator And Editor Following Instructions Via Diffusion Transformer

    使用场景设计师使用ACE创建独特的艺术作品游戏开发者利用ACE生成游戏内的场景和角色研究人员使用ACE进行视觉生成领域的实验和研究产品特色支持多种视觉生成任务的...
    AI图像生成,AI模型,视觉生成,扩散模型,多模态,Transformer,图像编辑,普通产品,开源, 08月02日 0 0
  • 2233.ai

    使用场景艺术家使用DALL-E功能创作了一系列独特的艺术作品。内容创作者利用2233.ai快速生成了一篇关于科技趋势的文章。软件开发团队通过Claude Art...
    AI聊天机器人,AI工具网址目录,人工智能,对话服务,隐私保护,多模态,创作工具,工作效率,普通产品 08月02日 0 0
  • Marqo

    使用场景Redbubble使用Marqo在试点后看到了团队的支持和专业知识,从而轻松做出了选择。Cohere的CEO认为Marqo通过使开发人员能够轻松使用最佳...
    AI搜索引擎,AI模型,嵌入式模型,语义搜索,多模态,多语言支持,可扩展性,普通产品 08月02日 0 0
  • Aria

    使用场景使用Aria模型为教育视频自动生成字幕。在医疗领域,利用Aria模型分析医疗影像和病例文档,以辅助诊断。在安全监控领域,使用Aria模型分析视频流,以识...
    AI模型,AI模型推理训练,多模态,混合专家模型,视频理解,文档处理,开源模型,普通产品,开源, 08月02日 0 0
  • MM1.5

    使用场景研究人员使用MM1.5模型进行文本丰富的图像分析,以提高图像识别的准确性。开发者利用MM1.5模型的多图像推理能力,开发了一款能够理解复杂场景的智能应用...
    AI模型,AI图像生成,多模态,大型语言模型,图像理解,视觉指代,数据优化,模型训练,普通产品,开源, 08月02日 0 0