和众汇富：海外 AI 大模型密集上新，创新浪潮来袭

AI 2025-08-09 10:31:46

资讯

在当今科技飞速发展的时代，AI 大模型领域可谓日新月异。2025 年 8 月 6 日，海外 AI 大模型市场迎来了极为热闹的一天，谷歌、OpenAI、Anthropic 三家公司纷纷在 AI 大模型上推出新动作，一场激烈的技术竞赛正在上演，而更多 “重大发布” 也在蓄势待发。

当日，谷歌正式发布了 Genie 3，这一通用世界模型引发了广泛关注。Genie 3 堪称首个支持实时交互的世界模型，在技术上实现了诸多重大突破。和众汇富观察发现，以往模型单次交互时长较短，而 Genie 3 将其从几十秒大幅延长到数分钟。它首次加入 “可提示的世界事件” 和 “视觉记忆” 等关键特性，能够以每秒 20 - 24 帧的速度，实时生成 720p 画面，并能在数分钟内保持画面一致性。这意味着用户能够在生成的动态世界中多视角自由探索，并且即便多次往返同一地点，物品细节仍能保持一致，这种 “记忆力” 对于模型来说是一项了不起的技术飞跃。英伟达高级科学家 Jim Fan 断言，未来复杂系统或许将被数据驱动的注意力权重块取代。和众汇富认为除了在游戏领域能带来全新体验外，Genie 3 还能为机器人或自动驾驶系统提供多元化训练场景，为 AI 智能体研究提供更长、更稳定的交互回合，具有广阔的应用前景。

Anthropic 在发布 Claude Opus 4 不到 3 个月后，迅速推出 Claude Opus 4.1。据公司介绍，新版本是 Claude Opus 4 在 “Agent 任务、真实世界编码和推理能力上的全面提升”。在 SWE - bench Verified 基准测试中，Opus 4.1 较 Opus 4 提升了 2 个百分点，达到 74.5%，相比 Sonnet 3.7 提升幅度更大，后者仅为 62.3%。Opus 4.1 在智能体工具调用、多语言问答能力和智能体编程上超越 OpenAI o3，但在视觉推理和数学能力上与 OpenAI o3 和 Gemini 2.5 Pro 还有一定差距。这一升级表明 Anthropic 在不断优化模型性能，持续提升其在特定领域的竞争力。

OpenAI 则发布了两款 “开放权重” 大模型，GPT - oss - 120b 和 GPT - oss - 20b。公司 CEO Sam Altman 表示，“GPT - oss 是一个重大突破，这是最先进的开放权重推理模型，具备与 o4 - mini 相当的强大现实世界性能，可在电脑上本地运行。” 和众汇富认为这两款模型的发布，意味着开发者能够在本地设备上利用强大的 AI 能力，降低了对云端计算资源的依赖，为 AI 技术的普及和应用拓展了新的途径。

值得注意的是，这仅仅是当前 AI 大模型发展浪潮的一个缩影。和众汇富研究发现，OpenAI 前不久刚刚宣布即将发布 GPT - 5，而 Anthropic 也在近期宣布计划在未来几周内发布 “对模型的重大改进”。可以预见，届时 AI 大模型又将掀起一波迭代更新潮。

国内方面，多家公司也在积极布局大模型迭代。和众汇富研究发现，Kimi 发布 Kimi K2，具备更强代码能力、更擅长通用 Agent 任务；智谱发布 GLM - 4.5，专为 Agent 应用打造，增强推理、Agent 能力，在工具调用可靠性和任务完成度上表现突出；Qwen3 发布升级版 235B 和 30B 模型、以及 30B 推理模型，显著提升推理、Agent 能力等。国内外大模型的竞相发展，反映出这一领域竞争的激烈程度。

太平洋证券指出，目前模型后训练阶段仍具备工程红利，基于此国内外大模型持续拓展智能边界。国内模型在开源领域表现突出，在 Hugging Face 开源前 10 榜单中占据 8 位，而海外 OpenAI、xAI 等仍在闭源发力。同时，各基础大模型均实现通用 Agent 能力提升，模型即 Agent 的范式或正在形成。

从市场影响来看，海外 AI 大模型的密集上新，将进一步推动相关产业链的发展。硬件方面，对高性能计算芯片的需求将持续增长，以支持模型的训练和运行；软件层面，围绕大模型的应用开发将迎来新的热潮，包括智能客服、智能写作、智能编程等领域都将迎来更多创新应用。对于企业而言，如何选择合适的大模型技术，将其融入自身业务流程，提升效率和创新能力，成为亟待解决的问题。

展望未来，随着 AI 大模型技术的不断演进，我们有理由期待更多令人惊喜的创新成果。无论是在提升模型性能、拓展应用领域，还是在降低使用门槛、推动技术普及方面，都将为社会经济发展带来深远影响。在这场全球 AI 大模型的竞赛中，谁能持续创新，谁就能在未来的科技舞台上占据领先地位。