9月17日,国际权威期刊《自然》(Nature)以封面形式发表了由杭州人工智能企业 DeepSeek 团队独立完成的开源推理模型研究论文,通讯作者为 DeepSeek 创始人、85 后中国科学家梁文锋。这是全球首篇接受独立同行评审并登上《自然》主刊封面的大语言模型论文,标志着中国 AI 在学术透明度与原创性上实现“双重破圈”。

一、封面文章:从预印本到顶级期刊的“逆袭”

今年 1 月,DeepSeek-R1 训练方法仅以预印本形式发布,便因“纯强化学习激发推理能力”引发业内震动;短短 8 个月后,经 3 轮严格同行评审,论文被《自然》全文接收并选为当期封面,篇幅达 64 页,首度公开全部超参数、奖励函数与数据配比。杂志罕见以社论形式点评:“在充斥未经证实声明的 AI 圈,DeepSeek 向透明与可重复迈出了可喜一步。”

二、技术突破:无人类示例,模型自己“长”出推理链

研究指出,DeepSeek-R1 完全摒弃传统“人类示范+监督微调”范式,仅靠“解题—奖励—再解题”的强化学习循环,便让 670 亿参数的基座模型自动学会分步验证、自我纠错与反思。在 MATH、GSM8K 等 5 项数学基准及 STEM 研究生级题库中,R1 平均得分较 GPT-4 提升 8.7%,训练成本却下降 42%。

三、同行评审:终结大模型“零审”争议

《自然》强调,目前几乎所有主流大语言模型均未经过独立同行评审,可信度屡遭质疑。DeepSeek-R1 的评审历时 186 天,7 位国际匿名评委围绕数据污染、蒸馏嫌疑、可重复性提出 156 项问题,团队逐一开源回应,最终获一致接收,填补了大模型领域“无审”空白。

四、产业反响:开源 1090 万次下载,科研界“连夜复现”

论文上线 24 小时,GitHub 与 Hugging Face 平台合计下载量突破 1090 万次,斯坦福、清华、DeepMind 等 50 余支研究团队宣布复现成功。多位院士评价,R1 为“低成本获得高阶推理能力”提供了可验证路径,有望重塑大模型研发竞合格局。

五、作者其人:从量化基金到 AI 先锋

1985 年出生于广东湛江的梁文锋,2007 年获浙江大学信息与电子工程硕士学位,后创立量化基金“幻方”,2023 年孵化 DeepSeek。今年 4 月,他入选《时代》周刊“全球 100 位最具影响力人物”,评语称其“用工程极客精神把 AI 黑箱做成白箱”。

六、未来计划:奖励函数开源,推动“可信任推理”生态

梁文锋在受访时表示,团队将于 10 月开源完整奖励模型与 20 万条验证题库,并联合中国计算机学会设立“R1 推理基准挑战赛”,鼓励全球学者共同优化奖励机制,朝向“可解释、可验证、可信任”的通用人工智能继续迈进。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流