一、Grok 4发布,马斯克称其为大爆炸级别的智能进化

2025年7月9日,马斯克旗下的人工智能公司xAI正式发布了Grok 4,这是该公司自2023年推出首代大模型以来的第四次重要迭代。Grok 4包含Grok 4和Grok 4 Heavy两个版本,均为纯推理模型,其中Grok 4 Heavy支持四个代理同时工作,上下文窗口最高支持256k tokens。马斯克在推特上表示,Grok 4是“大爆炸级别的智能进化”,其官方账号更是称其为“地表最强”的AI模型。

二、性能突破,Grok 4在多个领域达到博士水平

Grok 4在多个权威基准测试中表现优异,超越了包括OpenAI o3、Google Gemini 2.5 Pro和Anthropic Claude 4 Opus等在内的竞争对手。在“人类最后的考试”(Humanity’s Last Exam)中,Grok 4 Heavy取得了50.7%的突破性成绩,成为首个在该考试中突破50%准确率的模型。此外,在AIME 2025和MMLU-Pro这两项权威测试中,Grok 4分别斩获94%和87%的惊人得分。马斯克甚至表示,Grok 4在所有学术领域都达到了博士水平。

三、技术创新,Grok 4引入多模态和强化学习

Grok 4在训练过程中大幅引入了以推理能力为核心的强化学习训练,其训练量是Grok 2的100倍。xAI的Colossus超级计算机已扩展到20万个GPU,使其在强化学习中的计算能力比竞争对手高出10倍。Grok 4还首次尝试加入多模态信息处理,如图像、视频的潜力,使其在社交媒体内容上的应用更具时效性和文化敏感性。此外,Grok 4还新增了五种声音模式,反应速度较早期几乎缩短了一半。

四、应用广泛,Grok 4助力科研、商业与教育

Grok 4不仅在学术领域表现卓越,其在实际应用场景中也展现出巨大潜力。例如,在LiveCodeBench编程测试中,Grok 4取得了88%的编码准确率,创造了历史最高纪录。此外,Grok 4在药物发现、自动零售、生物医疗等领域也有出色表现。xAI还推出了专门的编程模型Grok 4 Code,用于代码生成、调试和解释逻辑,直逼GitHub Copilot与GPT-4的水平。

五、市场反响与定价策略

Grok 4的发布引发了市场的广泛关注,其定价策略也备受关注。目前,Grok 4的定价与Grok 3持平,每百万输入token收取3美元,输出为15美元,缓存输入更低至0.75美元。xAI还推出了更高等级的订阅服务——SuperGrok Heavy,用户可以使用Grok 4 Heavy模型。尽管Grok 4的性能强大,但也有技术观察者提醒,AI的能力提升并非没有极限。 马斯克对Grok 4的未来充满信心,他预测Grok 4将在今年内实现科学新发现,并可能在明年具备发现新物理规律的能力。xAI还计划推出代码模型、多模态智能体以及视频生成模型,进一步拓展Grok 4的应用范围。随着Grok 4的不断进化,其在科研、商业、教育等领域的应用将更加广泛,推动人工智能技术的进一步发展。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流