Yuan2.0 M32 Hf Int8

使用场景用于开发复杂的编程项目,提高代码生成的准确性在数学问题求解中提供精确的计算和推理应用于专业领域的知识获取和文本生成产品特色32个专家中只有2个活跃,提高...

  • Yuan2.0 M32 Hf Int8

    类别:AI模型,AI语言模型,混合专家模型,注意力路由器,高效能,编程,数学,普通产品,开源,
    官网:https://huggingface.co/IEITYuan/Yuan2-M32-hf-int8 更新时间:2025-08-01 18:55:37
  • 使用场景

    用于开发复杂的编程项目,提高代码生成的准确性

    在数学问题求解中提供精确的计算和推理

    应用于专业领域的知识获取和文本生成

    产品特色

    32个专家中只有2个活跃,提高效率

    使用注意力路由器,提升准确率3.8%

    从头开始训练,使用2000亿个token

    训练计算量小,仅占同等规模密集模型的9.25%

    在编程、数学等领域有竞争力

    在MATH和ARC-Challenge基准测试中表现优异

    使用教程

    1. 配置环境,使用推荐的docker镜像启动Yuan2.0容器

    2. 根据提供的脚本进行数据预处理

    3. 使用示例脚本进行模型预训练

    4. 参考vllm文档进行详细部署以提供推理服务

    5. 访问GitHub仓库获取更多信息