在当今科技飞速发展的时代,AI 大模型领域可谓日新月异。2025 年 8 月 6 日,海外 AI 大模型市场迎来了极为热闹的一天,谷歌、OpenAI、Anthropic 三家公司纷纷在 AI 大模型上推出新动作,一场激烈的技术竞赛正在上演,而更多 “重大发布” 也在蓄势待发。
当日,谷歌正式发布了 Genie 3,这一通用世界模型引发了广泛关注。Genie 3 堪称首个支持实时交互的世界模型,在技术上实现了诸多重大突破。和众汇富观察发现,以往模型单次交互时长较短,而 Genie 3 将其从几十秒大幅延长到数分钟。它首次加入 “可提示的世界事件” 和 “视觉记忆” 等关键特性,能够以每秒 20 - 24 帧的速度,实时生成 720p 画面,并能在数分钟内保持画面一致性。这意味着用户能够在生成的动态世界中多视角自由探索,并且即便多次往返同一地点,物品细节仍能保持一致,这种 “记忆力” 对于模型来说是一项了不起的技术飞跃。英伟达高级科学家 Jim Fan 断言,未来复杂系统或许将被数据驱动的注意力权重块取代。和众汇富认为除了在游戏领域能带来全新体验外,Genie 3 还能为机器人或自动驾驶系统提供多元化训练场景,为 AI 智能体研究提供更长、更稳定的交互回合,具有广阔的应用前景。
Anthropic 在发布 Claude Opus 4 不到 3 个月后,迅速推出 Claude Opus 4.1。据公司介绍,新版本是 Claude Opus 4 在 “Agent 任务、真实世界编码和推理能力上的全面提升”。在 SWE - bench Verified 基准测试中,Opus 4.1 较 Opus 4 提升了 2 个百分点,达到 74.5%,相比 Sonnet 3.7 提升幅度更大,后者仅为 62.3%。Opus 4.1 在智能体工具调用、多语言问答能力和智能体编程上超越 OpenAI o3,但在视觉推理和数学能力上与 OpenAI o3 和 Gemini 2.5 Pro 还有一定差距。这一升级表明 Anthropic 在不断优化模型性能,持续提升其在特定领域的竞争力。
OpenAI 则发布了两款 “开放权重” 大模型,GPT - oss - 120b 和 GPT - oss - 20b。公司 CEO Sam Altman 表示,“GPT - oss 是一个重大突破,这是最先进的开放权重推理模型,具备与 o4 - mini 相当的强大现实世界性能,可在电脑上本地运行。” 和众汇富认为这两款模型的发布,意味着开发者能够在本地设备上利用强大的 AI 能力,降低了对云端计算资源的依赖,为 AI 技术的普及和应用拓展了新的途径。
值得注意的是,这仅仅是当前 AI 大模型发展浪潮的一个缩影。和众汇富研究发现,OpenAI 前不久刚刚宣布即将发布 GPT - 5,而 Anthropic 也在近期宣布计划在未来几周内发布 “对模型的重大改进”。可以预见,届时 AI 大模型又将掀起一波迭代更新潮。
国内方面,多家公司也在积极布局大模型迭代。和众汇富研究发现,Kimi 发布 Kimi K2,具备更强代码能力、更擅长通用 Agent 任务;智谱发布 GLM - 4.5,专为 Agent 应用打造,增强推理、Agent 能力,在工具调用可靠性和任务完成度上表现突出;Qwen3 发布升级版 235B 和 30B 模型、以及 30B 推理模型,显著提升推理、Agent 能力等。国内外大模型的竞相发展,反映出这一领域竞争的激烈程度。
太平洋证券指出,目前模型后训练阶段仍具备工程红利,基于此国内外大模型持续拓展智能边界。国内模型在开源领域表现突出,在 Hugging Face 开源前 10 榜单中占据 8 位,而海外 OpenAI、xAI 等仍在闭源发力。同时,各基础大模型均实现通用 Agent 能力提升,模型即 Agent 的范式或正在形成。
从市场影响来看,海外 AI 大模型的密集上新,将进一步推动相关产业链的发展。硬件方面,对高性能计算芯片的需求将持续增长,以支持模型的训练和运行;软件层面,围绕大模型的应用开发将迎来新的热潮,包括智能客服、智能写作、智能编程等领域都将迎来更多创新应用。对于企业而言,如何选择合适的大模型技术,将其融入自身业务流程,提升效率和创新能力,成为亟待解决的问题。
展望未来,随着 AI 大模型技术的不断演进,我们有理由期待更多令人惊喜的创新成果。无论是在提升模型性能、拓展应用领域,还是在降低使用门槛、推动技术普及方面,都将为社会经济发展带来深远影响。在这场全球 AI 大模型的竞赛中,谁能持续创新,谁就能在未来的科技舞台上占据领先地位。