近日,月之暗面公司(Moonshot AI)正式发布并同步开源其首个万亿参数基础大模型Kimi K2。该模型基于MoE架构,总参数量1 T、激活参数32 B,在代码生成、通用Agent与数学推理三大任务上刷新开源模型纪录,并推出兼容OpenAI格式、支持128 K上下文的商用API,每百万token输出定价16元。国内外开发者下载量20分钟破1.2万,被称为“开源圈一夜地震”。

一、Kimi K2技术突破:MuonClip优化器破解万亿参数训练难题

Kimi K2在训练阶段采用自研MuonClip优化器,通过qk-clip技术控制Attention logits规模,实现15.5 T tokens无损预训练,训练全程未出现损失尖峰。相较传统AdamW,MuonClip提升token利用率20%,为Scaling Law在高质量数据枯竭背景下提供了新的扩展路径。此外,模型通过减少Attention Heads并增加MoE稀疏性,在长上下文场景下保持高效推理,奠定“模型即Agent”技术底座。

二、基准与实战双重验证:开源新SOTA,多项指标超越闭源旗舰

在SWE-bench Verified、Tau2、AceBench等权威测试中,Kimi K2取得开源模型最好成绩;在LiveCode Bench、AIME2025与GPQA-Diamond中,其得分超越DeepSeek-V3-0324、Qwen3-235B-A22B等开源对手,并在部分维度逼近甚至反超GPT-4.1与Claude 4 Opus。现场演示中,Kimi K2仅凭一句自然语言提示便生成完整的3D HTML山脉场景,包含光照、粒子系统与交互逻辑;在另一案例中,模型通过17次工具调用自动完成Coldplay巡演行程规划,涵盖机票、酒店、餐厅预订及可视化报告。

三、开源与商用并举:两款模型同步放出,API即刻可用

月之暗面此次开源两个版本:Kimi-K2-Base(纯预训练,可自由微调)与Kimi-K2-Instruct(通用指令微调,适合开箱即用),均允许商用。官方同步上线兼容OpenAI与Anthropic协议的Chat API,支持128 K长上下文,输入4元/百万token、输出16元/百万token,开发者可一键切换原有集成。Hugging Face页面显示,开源文件发布20分钟内下载量接近1.2万次,社区热度可见一斑。

四、行业冲击与未来路线:月之暗面押注“模型即Agent”,视觉与深度思考将升级

Kimi K2的发布标志着国内首次开源万亿参数模型,直接对标即将开源的OpenAI与谷歌新Gemini,引发全球竞速。月之暗面明确表示,K2只是通用Agent能力的起点,下一步将增加视觉理解与深度思考模块,并持续优化长上下文效率,目标让模型在复杂现实任务中实现“零人工干预”的自主执行。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流