多模态

资讯

华科字节推出 Liquid：重新定义多模态模型的生成与理解

近年来，大语言模型（LLM）在人工智能领域取得了显著进展，尤其是在多模态融合方面。华中科技大学、字节跳动与香港大学的联合团队最近提出了一种新型的多模态生成框架 ...

字节,多模态 07月30日 0 0
资讯

多模态检索新突破！智源开源多模态向量模型BGE-VL

2025年3月6日，北京智源人工智能研究院宣布开源多模态向量模型BGE-VL，这一成果标志着多模态检索领域的新突破。BGE-VL模型在图文检索、组合图像检索等多...

多模态,开源 07月30日 0 0
资讯

Cohere发布全新多模态AI模型Aya Vision，提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称，该模型在行业内处于领先地位...

多模态,AI 07月30日 0 0
资讯

智源推出 BGE-VL 多模态向量模型，开启检索新纪元

在多模态人工智能领域，智源研究院与多所高校合作推出了全新的多模态向量模型 BGE-VL，标志着多模态检索技术的一次重大突破。自发布以来，BGE 系列模型便获得了...

多模态 07月30日 0 0
资讯

华为昇腾携手阶跃星辰推出开源多模态模型，进军 AI 新领域

近日，魔乐社区（Modelers）正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和...

华为,昇腾,阶跃星辰,开源,多模态,AI 07月30日 0 0
资讯

阿里通义宣布开源R1-Omni模型可提升多模态情感识别能力

3月11日，通义实验室团队宣布开源R1-Omni模型，为全模态模型的发展带来了新的突破。该模型结合了强化学习与可验证奖励（RLVR）方法，专注于提升多模态情感识...

阿里,通义,开源,多模态 07月30日 0 0
资讯

阿里通义团队开源 R1-Omni：多模态模型实现音视频信息透明化

在人工智能领域，阿里通义实验室团队近日宣布开源其最新研发的多模态模型 ——R1-Omni。这一模型结合了强化学习与可验证奖励（RLVR）方法，展现出了在处理音频...

阿里,通义,开源,多模态,视频 07月30日 0 0
资讯

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关...

谷歌,开源,多模态,性能,成本 07月30日 0 0
资讯

谷歌Gemini 2.0 Flash放出原生多模态图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成...

谷歌,多模态,图像生成,对话 07月30日 0 0
资讯

AI日报：重磅！阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产...

AI,阿里,新夸克,夸克,升级,谷歌,开源,多模态,潞晨科技,科技,视频,大模型,Sora 07月30日 0 0

点击加载更多