近日,谷歌旗下人工智能助手Gemini迎来了一次重大功能升级,其备受期待的“Gemini Live”视觉对话能力正式在Pixel9系列手机上上线。这一更新赋予了...
Gemini Live,视觉,对话,AI,多模态
07月30日
0
近日,中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1,利用类 R1强化学习技术,显著提升了视觉定位的能力。这个方法不仅在目...
强化学习,视觉,定位,性能
07月30日
0
人工智能在图像生成领域的创新步伐从未停歇。近日,Hugging Face平台上线了一款名为VisualCloze的全新工具,以其独特的视觉上下文学习(Visua...
图像生成,视觉
07月30日
0
备受瞩目的国内人工智能公司 Moonshot AI (月之暗面) 近日宣布,正式开源发布了两款全新的视觉语言模型——Kimi-VL 与 Kimi-VL-Thin...
开源,视觉,语言模型,Kimi,GPT
07月30日
0
在人工智能领域,3D视觉与空间理解技术正成为推动具身智能、自主导航及虚拟现实等应用的关键。2025年3月,杭州群核科技在GTC2025全球大会上宣布正式开源其自...
3D,视觉,大模型,开源,实时识别
07月30日
0
人工智能领域迎来一项重大突破。AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(L...
字节,开源,多模态,视觉
07月30日
0
在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。豆包1.5...
火山引擎,豆包,深度思考,视觉
07月30日
0
由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功...
Grok,视觉,音频,搜索,上线
07月30日
0
AI视觉革命!受人脑启发的新技术让机器“看”得更准、更高效告别传统死板的方形“滤镜”,一种名为Lp-Convolution的新AI技术横空出世!它模仿人脑视觉皮...
AI,视觉
07月30日
0
xAI宣布为其旗舰AI助手Grok推出全新Grok Vision功能,标志着Grok在多模态交互领域的重大突破。据AIbase了解,Grok Vision通过智...
AI,Grok,视觉,智能交互
07月30日
0