性能

资讯

国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

正文:近期，中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1，受到了广泛关注。R1模型的性能表现极其出色，在多项测试中均超越了 OpenAI 的 ...

开源,大模型,DeepSeek,性能,成本 07月30日 0 0
资讯

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

字节跳动正式推出其最新的豆包大模型1.5Pro（Doubao-1.5-pro），这一新模型在多个领域的综合能力上表现出色，成功超越了行业内知名的 GPT-4o ...

字节,豆包,大模型,性能,GPT,Claude 07月30日 0 0
资讯

Hugging Face 推出小巧AI模型，助力设备性能提升

近期，人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型，SmolVLM-256M 和 SmolVLM-500M。他们自信地声称，这两款...

Hugging Face,AI,性能 07月30日 0 0
资讯

中国联通发布元景思维链大模型：性能超越GPT-4o 比肩OpenAI o1

今日，中国联通宣布，其旗下联通数据智能有限公司正式发布了元景思维链大模型。这一创新成果已在GitHub、魔搭、始智等多个社区全面开源，标志着中国联通在人工智能领...

大模型,性能,GPT,OpenAI,AI 07月30日 0 0
资讯

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

谷歌扩展了其人工智能模型家族，推出了三款新版本的 Gemini2.0模型，分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Li...

谷歌,性能,成本 07月30日 0 0
资讯

重磅！斯坦福等高效联手推出AI训练新方法S1，成本暴降性能飙升！

斯坦福大学和华盛顿大学的研究团队近日联合发布了一项突破性的AI训练方法，该方法名为S1，其核心理念在于利用极简的测试时缩放技术来显著提升语言模型的推理能力。与以...

AI,成本,性能 07月30日 0 0
资讯

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示，包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的...

AI,语言模型,性能 07月30日 0 0
资讯

韩国政府计划采购10000个高性能 GPU，助力 AI 竞争

在全球人工智能（AI）竞争日益激烈的背景下，韩国政府近日宣布了一个重要计划。代理总统崔相穆表示，政府将通过公私合作的方式，尽快采购10000个高性能 GPU，以...

性能,GPU,AI 07月30日 0 0
资讯

OpenAI 推出 SWE-Lancer 基准测试:评估真实世界自由软件工程工作的模型性能

在软件工程领域，随着挑战的不断演变，传统的基准测试方法显得力不从心。自由职业的软件工程工作复杂多变，远不止是孤立的编码任务。自由职业工程师需要处理整个代码库，集...

OpenAI,AI,性能 07月30日 0 0
资讯

DeepSeek 开源周首日：发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA，这是一款专为英伟达Hopper架构GPU打造的高效多层注意力（Multi-Layer Att...

DeepSeek,开源,大模型,加速,性能 07月30日 0 0

点击加载更多