正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 ...
开源,大模型,DeepSeek,性能,成本
07月30日
0
字节跳动正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),这一新模型在多个领域的综合能力上表现出色,成功超越了行业内知名的 GPT-4o ...
字节,豆包,大模型,性能,GPT,Claude
07月30日
0
近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。他们自信地声称,这两款...
Hugging Face,AI,性能
07月30日
0
今日,中国联通宣布,其旗下联通数据智能有限公司正式发布了元景思维链大模型。这一创新成果已在GitHub、魔搭、始智等多个社区全面开源,标志着中国联通在人工智能领...
大模型,性能,GPT,OpenAI,AI
07月30日
0
谷歌扩展了其人工智能模型家族,推出了三款新版本的 Gemini2.0模型,分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Li...
谷歌,性能,成本
07月30日
0
斯坦福大学和华盛顿大学的研究团队近日联合发布了一项突破性的AI训练方法,该方法名为S1,其核心理念在于利用极简的测试时缩放技术来显著提升语言模型的推理能力。与以...
AI,成本,性能
07月30日
0
慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的...
AI,语言模型,性能
07月30日
0
在全球人工智能(AI)竞争日益激烈的背景下,韩国政府近日宣布了一个重要计划。代理总统崔相穆表示,政府将通过公私合作的方式,尽快采购10000个高性能 GPU,以...
性能,GPU,AI
07月30日
0
在软件工程领域,随着挑战的不断演变,传统的基准测试方法显得力不从心。自由职业的软件工程工作复杂多变,远不止是孤立的编码任务。自由职业工程师需要处理整个代码库,集...
OpenAI,AI,性能
07月30日
0
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Att...
DeepSeek,开源,大模型,加速,性能
07月30日
0