近日,华为公司在2025全联接大会上宣布,将于2026年第一季度推出新一代人工智能芯片“昇腾950PR”,并同步发布全球首个支持8192张加速卡的超节点Atlas 950 SuperPoD。华为轮值董事长徐直军称,该组合“将在集群层面提供全球最强AI算力”,直接对标英伟达2027年才会面世的NVL576系统。尽管单颗芯片性能仍落后国际顶尖水平,但华为通过自研互联协议“灵衢”把万卡级集群整合成一台“超级计算机”,宣称已找到“系统级效率突围”的新路径。

一、三年四芯路线图:一年一代、算力翻倍

徐直军首次披露未来三年昇腾芯片完整规划: 2026 Q1 昇腾950PR——自研HBM高带宽内存,FP8算力1 PFLOPS 2026 Q4 昇腾950DT——同一芯片封装双Die,FP8算力2 PFLOPS 2027 Q4 昇腾960——全规格翻倍,支持自研Hi-F4格式,FP4算力4 PFLOPS 2028 Q4 昇腾970——再翻倍,FP4算力8 PFLOPS,片上288 GB HBM,带宽14.4 TB/s 华为表示,将保持“一年一代、算力翻倍”的节奏,以“系统级芯片+超节点”的组合弥补先进制程受限带来的单芯差距。

二、Atlas超节点:万卡集群拼成“一台机器”

Atlas 950 SuperPoD:8192卡,预计2025 Q4上市,单节点算力300 PFlops,已交付300余套 Atlas 960 SuperPoD:15488卡,2027 Q4上市,把集群规模再抬一级 对应集群:Atlas 950 SuperCluster超50万卡,Atlas 960 SuperCluster达百万卡规模,华为称“未来多年保持全球最强” 关键技术是华为自研“灵衢”互联协议,单端口速率1.6 Tbps,端到端延迟低于3微秒,可把数千台服务器“像一台机器”统一调度;华为宣布年内开放灵衢2.0规范,邀请伙伴共同做生态。

三、开源组合拳:硬件开放、软件全部捐社区

硬件:NPU模组、液冷刀片、AI标卡、主板全部提供参考设计 软件:CANN编译器、MindStudio工具链、openPangu大模型全面开源,代码并入openEuler社区 华为称“硬件变现、软件开源”是为了降低伙伴准入门槛,加速行业替换英伟达生态。

四、市场反应:资本热捧,客户“等不及”

发布会当日,华为昇腾概念股集体拉升,利和兴、东华软件等多股涨停。彭博社报道,中国头部互联网公司已暂停采购英伟达“减配特供版”,等待昇腾950PR实测数据。徐直军透露,目前Atlas 900 A3超节点已服务20多家客户,累计运行时间超120万卡时,“客户最担心的是我们供货速度不够快”。

五、挑战与展望:单芯差距仍在,系统创新能否持续?

华为内部评估显示,昇腾950PR单卡FP16算力仅相当于英伟达B200的70%,但通过8192卡并联可把训练效率提升1.8倍。业内分析指出,一旦模型规模突破万亿参数,“集群就是新的芯片”,华为的互联技术确实暂时领先;然而随着台积电3 nm产能放开,英伟达、AMD下一代单芯算力仍可能再次拉大。因此华为能否在2027年前完成生态替代,将决定“全球最强”这一定位的可持续性。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流