-
通义千问重磅开源Qwen-Image:20B参数MMDiT模型全面刷新图像生成SOTA
通义千问8月5日正式开源了其首个图像生成基础模型Qwen-Image,这款20B参数的MMDiT(多模态扩散变换器)模型在文本渲染和图像编辑领域实现了重大突破。... -
覆盖近1.5万个物种,谷歌DeepMind发布Perch 2.0,刷新生物声学分类检测SOTA
Google DeepMind 与 Google Research 联合推出的 Perch 2.0,进一步将生物声学研究推向新高度。相较于前代,Perch 2.... -
智谱GLM-4.5V开源发布,引领多模态AI新高度
近日,智谱AI正式推出并开源新一代视觉推理模型GLM-4.5V,标志着中国在视觉-语言模型领域再次取得重要突破。该模型总参数量达1060亿,激活参数约120亿,...