马斯克旗下xAI发布Grok 4，号称“世界上最强AI模型”

AI 2025-07-29 18:03:04

资讯

一、Grok 4发布，马斯克称其为大爆炸级别的智能进化

2025年7月9日，马斯克旗下的人工智能公司xAI正式发布了Grok 4，这是该公司自2023年推出首代大模型以来的第四次重要迭代。Grok 4包含Grok 4和Grok 4 Heavy两个版本，均为纯推理模型，其中Grok 4 Heavy支持四个代理同时工作，上下文窗口最高支持256k tokens。马斯克在推特上表示，Grok 4是“大爆炸级别的智能进化”，其官方账号更是称其为“地表最强”的AI模型。

二、性能突破，Grok 4在多个领域达到博士水平

Grok 4在多个权威基准测试中表现优异，超越了包括OpenAI o3、Google Gemini 2.5 Pro和Anthropic Claude 4 Opus等在内的竞争对手。在“人类最后的考试”(Humanity’s Last Exam)中，Grok 4 Heavy取得了50.7%的突破性成绩，成为首个在该考试中突破50%准确率的模型。此外，在AIME 2025和MMLU-Pro这两项权威测试中，Grok 4分别斩获94%和87%的惊人得分。马斯克甚至表示，Grok 4在所有学术领域都达到了博士水平。

三、技术创新，Grok 4引入多模态和强化学习

Grok 4在训练过程中大幅引入了以推理能力为核心的强化学习训练，其训练量是Grok 2的100倍。xAI的Colossus超级计算机已扩展到20万个GPU，使其在强化学习中的计算能力比竞争对手高出10倍。Grok 4还首次尝试加入多模态信息处理，如图像、视频的潜力，使其在社交媒体内容上的应用更具时效性和文化敏感性。此外，Grok 4还新增了五种声音模式，反应速度较早期几乎缩短了一半。

四、应用广泛，Grok 4助力科研、商业与教育

Grok 4不仅在学术领域表现卓越，其在实际应用场景中也展现出巨大潜力。例如，在LiveCodeBench编程测试中，Grok 4取得了88%的编码准确率，创造了历史最高纪录。此外，Grok 4在药物发现、自动零售、生物医疗等领域也有出色表现。xAI还推出了专门的编程模型Grok 4 Code，用于代码生成、调试和解释逻辑，直逼GitHub Copilot与GPT-4的水平。

五、市场反响与定价策略

Grok 4的发布引发了市场的广泛关注，其定价策略也备受关注。目前，Grok 4的定价与Grok 3持平，每百万输入token收取3美元，输出为15美元，缓存输入更低至0.75美元。xAI还推出了更高等级的订阅服务——SuperGrok Heavy，用户可以使用Grok 4 Heavy模型。尽管Grok 4的性能强大，但也有技术观察者提醒，AI的能力提升并非没有极限。马斯克对Grok 4的未来充满信心，他预测Grok 4将在今年内实现科学新发现，并可能在明年具备发现新物理规律的能力。xAI还计划推出代码模型、多模态智能体以及视频生成模型，进一步拓展Grok 4的应用范围。随着Grok 4的不断进化，其在科研、商业、教育等领域的应用将更加广泛，推动人工智能技术的进一步发展。