近日,xAI创始人埃隆·马斯克在延迟近一小时后正式发布Grok 4系列模型,声称其“在所有主要学科的表现已超越博士水平”。目前,Grok 4提供两种可用形态——单智能体版Grok 4与多智能体版Grok 4 Heavy,并同步开放API与订阅服务。本文梳理其性能亮点、接入方式、收费标准与落地场景,帮助读者快速锁定“哪里可以用”。
一、性能速览:为什么被称作“全球最强”
学术基准:在覆盖2500道高难度问题的“人类最后考试”(HLE)中,Grok 4无工具版本正确率25.4%,配备工具后Grok 4 Heavy达44.4%,领先Gemini 2.5 Pro、OpenAI o3等对手。
推理与编码:ARC-AGI-2测试中取得15.9%的新纪录,几乎是此前最佳成绩的两倍;LiveCodeBench、SciCode等编程测评亦居榜首。
多模态与语音:新增五种声音角色,支持256k token长上下文,并计划年末开放视频理解与生成。
二、使用渠道:目前可在三处体验
X(原Twitter)内嵌机器人:所有X Premium+用户(月费16美元)可直接在App内与Grok 4对话,无需额外申请。
独立网页版:xAI官网已上线Grok Chat网页端,登录X账号即可使用;Grok 4 Heavy需开通SuperGrok Heavy订阅。
API调用:开发者可通过xAI官方API接入,输入3美元/百万token、输出15美元/百万token;Grok 4 Heavy暂未公开API,需提交企业级申请。
三、收费方案:从每月16美元到年费超2万元人民币
X Premium+:16美元/月,可无限次使用Grok 4单智能体版。
SuperGrok Heavy:3000美元/年(约2.17万元人民币),解锁“最强模型”Grok 4 Heavy、优先体验多智能体并行推理及后续视频能力。
API按量计费:适合企业或开发者,价格见上文。
四、落地场景:科研、编码与实时内容生产
科研建模:多智能体架构可让不同子模型并行验证假设,已在美国数所高校试点用于材料计算。
代码开发:集成Grok 4 Code模式,支持整文件级Bug修复与跨语言迁移,xAI称“比Cursor更好用”。
社交媒体运营:实时抓取X平台热梗,可生成带语调的多语言短视频脚本,已被部分MCN机构用于热点追踪。
五、注意事项与风险提示
体验门槛:Grok 4 Heavy仍处于小规模内测,普通用户需排队;API访问需绑定境外信用卡。
稳定性争议:发布会演示中Grok 4曾把“唱歌”指令误执行为“朗读”,暴露多模态同步问题。
伦理合规:过往争议言论使品牌信任度存在波动,金融、医疗等敏感场景应谨慎接入。
AD:精心整理了2000+好用的AI工具!点此获取