2025年9月29日,人工智能公司Anthropic正式发布了其最新的人工智能模型——Claude Sonnet 4.5。该模型在编码、推理、计算机使用以及多步骤任务处理等方面展现出显著的提升,被定位为全球最强的代码模型。Anthropic还对Claude全线产品进行了大规模更新,包括新增检查点功能、上下文编辑功能和记忆工具等。此外,Claude Sonnet 4.5在安全性方面也取得了重要进展,成为Anthropic迄今为止最安全的模型。

一、性能提升

Claude Sonnet 4.5在多个行业标准基准测试中取得了优异的成绩。在衡量实际软件编程能力的SWE-bench Verified评测中,Claude Sonnet 4.5达到了业界领先水平。在测试AI模型实际计算机任务能力的OSWorld基准测试中,Sonnet 4.5的得分从四个月前的42.2%跃升至61.4%。此外,该模型还展现出在长任务处理上的强大能力,能够保持超过30小时的专注度来处理复杂的多步骤任务。

二、产品升级

Anthropic对Claude全线产品进行了大规模更新,以更好地支持Sonnet 4.5的性能。在Claude Code中,新增了检查点功能,用户可以随时保存进度并一键回滚到早先状态。同时,更新了终端界面,并推出了原生VS Code插件。Claude API增加了上下文编辑功能和记忆工具,让智能体能够运行更长时间并处理更复杂的任务。Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。此外,Claude for Chrome扩展程序也对上个月加入等待列表的Max用户开放。

三、安全性增强

Claude Sonnet 4.5是Anthropic迄今为止最安全的模型。通过广泛的安全训练,该模型的行为表现得到了显著改善,减少了诸如奉承、欺骗、权力寻求等不良行为。此外,Claude Sonnet 4.5对“提示注入攻击”的抵御能力也更强,这种攻击会诱导模型执行恶意操作,例如泄露敏感数据。该模型在AI Safety Level 3(ASL-3)保护下发布,这些保护措施包括能够检测危险输入和输出的过滤器和分类器。

四、应用场景广泛

Claude Sonnet 4.5适用于多种应用场景。它能够直接在浏览器中工作,浏览网站、填写电子表格并完成任务。该模型在金融、研究和网络安全等领域的应用也表现出色。此外,Claude Sonnet 4.5还为开发者提供了强大的支持,通过Claude Agent SDK,开发者可以利用驱动Claude Code的底层基础设施来构建智能体。

五、用户反馈积极

Claude Sonnet 4.5的发布受到了用户的广泛好评。许多用户表示,该模型在处理复杂任务时表现出色,能够显著提高工作效率。例如,有用户提到,Claude Sonnet 4.5在解决代码问题时表现出色,能够快速找到解决方案。此外,该模型在生成软件、处理文件等方面也展现出了强大的能力。 Claude Sonnet 4.5的发布标志着Anthropic在人工智能领域取得了重要的进展。该模型不仅在性能上取得了显著提升,还在安全性方面做出了重要贡献。随着Claude Sonnet 4.5的广泛应用,我们有理由相信,它将在多个领域带来更多的创新和突破。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流