Xiaomi MiMo

使用场景研究人员可以使用MiMo进行复杂的数学推理研究,提升模型在数学问题上的表现。开发者可以将MiMo集成到代码编辑器中,为程序员提供实时代码建议和优化方案。...

  • Xiaomi MiMo

    类别:AI模型,代码助手,"推理模型、人工智能、开源、数学推理、代码生成、强化学习",优质新品,开源,
    官网:https://huggingface.co/XiaomiMiMo 更新时间:2025-08-02 10:49:25
  • 使用场景

    研究人员可以使用MiMo进行复杂的数学推理研究,提升模型在数学问题上的表现。

    开发者可以将MiMo集成到代码编辑器中,为程序员提供实时代码建议和优化方案。

    企业可以利用MiMo的推理能力优化业务流程,例如在金融领域进行风险评估和预测。

    产品特色

    预训练阶段,着重挖掘富推理语料,合成约200B tokens推理数据,确保模型见过更多推理模式。

    进行三阶段训练,逐步提升训练难度,总训练量达到25T tokens,全面提升模型的推理能力。

    在后训练阶段,提出Test Difficulty Driven Reward策略,缓解困难算法问题中的奖励稀疏问题,引入Easy Data Re-Sampling策略,稳定RL训练。

    设计Seamless Rollout系统,加速RL训练和验证,分别提升2.29倍和1.96倍的效率。

    在数学推理和代码竞赛公开测评集上,MiMo-7B的性能显著领先于其他同规模模型。

    MiMo-7B全系列已开源,提供4个模型至HuggingFace,方便研究人员和开发者使用。

    技术细节已在GitHub公开,包括完整的训练报告和技术文档,方便社区交流和进一步研究。

    MiMo模型由小米大模型Core团队开发,展示了小米在人工智能领域的创新能力和技术实力。

    使用教程

    访问HuggingFace上的MiMo模型页面:

    下载并安装所需的MiMo模型版本。

    使用HuggingFace提供的API或工具加载模型,并进行推理任务。

    根据需要对模型进行微调,以适应特定的推理任务或数据集。

    利用MiMo的技术报告和文档,深入了解模型的训练细节和使用技巧。