Anthropic发布新一代AI模型Claude Sonnet 4.5

AI 2025-10-02 09:33:33

资讯

2025年9月29日，人工智能公司Anthropic正式发布了其最新的人工智能模型——Claude Sonnet 4.5。该模型在编码、推理、计算机使用以及多步骤任务处理等方面展现出显著的提升，被定位为全球最强的代码模型。Anthropic还对Claude全线产品进行了大规模更新，包括新增检查点功能、上下文编辑功能和记忆工具等。此外，Claude Sonnet 4.5在安全性方面也取得了重要进展，成为Anthropic迄今为止最安全的模型。

一、性能提升

Claude Sonnet 4.5在多个行业标准基准测试中取得了优异的成绩。在衡量实际软件编程能力的SWE-bench Verified评测中，Claude Sonnet 4.5达到了业界领先水平。在测试AI模型实际计算机任务能力的OSWorld基准测试中，Sonnet 4.5的得分从四个月前的42.2%跃升至61.4%。此外，该模型还展现出在长任务处理上的强大能力，能够保持超过30小时的专注度来处理复杂的多步骤任务。

二、产品升级

Anthropic对Claude全线产品进行了大规模更新，以更好地支持Sonnet 4.5的性能。在Claude Code中，新增了检查点功能，用户可以随时保存进度并一键回滚到早先状态。同时，更新了终端界面，并推出了原生VS Code插件。Claude API增加了上下文编辑功能和记忆工具，让智能体能够运行更长时间并处理更复杂的任务。Claude apps现已支持在对话中直接执行代码、生成文件（包括表格、幻灯片和文档）。此外，Claude for Chrome扩展程序也对上个月加入等待列表的Max用户开放。

三、安全性增强

Claude Sonnet 4.5是Anthropic迄今为止最安全的模型。通过广泛的安全训练，该模型的行为表现得到了显著改善，减少了诸如奉承、欺骗、权力寻求等不良行为。此外，Claude Sonnet 4.5对“提示注入攻击”的抵御能力也更强，这种攻击会诱导模型执行恶意操作，例如泄露敏感数据。该模型在AI Safety Level 3（ASL-3）保护下发布，这些保护措施包括能够检测危险输入和输出的过滤器和分类器。

四、应用场景广泛

Claude Sonnet 4.5适用于多种应用场景。它能够直接在浏览器中工作，浏览网站、填写电子表格并完成任务。该模型在金融、研究和网络安全等领域的应用也表现出色。此外，Claude Sonnet 4.5还为开发者提供了强大的支持，通过Claude Agent SDK，开发者可以利用驱动Claude Code的底层基础设施来构建智能体。

五、用户反馈积极

Claude Sonnet 4.5的发布受到了用户的广泛好评。许多用户表示，该模型在处理复杂任务时表现出色，能够显著提高工作效率。例如，有用户提到，Claude Sonnet 4.5在解决代码问题时表现出色，能够快速找到解决方案。此外，该模型在生成软件、处理文件等方面也展现出了强大的能力。 Claude Sonnet 4.5的发布标志着Anthropic在人工智能领域取得了重要的进展。该模型不仅在性能上取得了显著提升，还在安全性方面做出了重要贡献。随着Claude Sonnet 4.5的广泛应用，我们有理由相信，它将在多个领域带来更多的创新和突破。