Yuan2.0 M32 Hf Int8_创作

Yuan2.0 M32 Hf Int8

类别：AI模型,AI语言模型,混合专家模型,注意力路由器,高效能,编程,数学,普通产品,开源,

官网:https://huggingface.co/IEITYuan/Yuan2-M32-hf-int8 更新时间：2025-08-01 18:55:37
使用场景
用于开发复杂的编程项目，提高代码生成的准确性
在数学问题求解中提供精确的计算和推理
应用于专业领域的知识获取和文本生成
产品特色
32个专家中只有2个活跃，提高效率
使用注意力路由器，提升准确率3.8%
从头开始训练，使用2000亿个token
训练计算量小，仅占同等规模密集模型的9.25%
在编程、数学等领域有竞争力
在MATH和ARC-Challenge基准测试中表现优异
使用教程
1. 配置环境，使用推荐的docker镜像启动Yuan2.0容器
2. 根据提供的脚本进行数据预处理
3. 使用示例脚本进行模型预训练
4. 参考vllm文档进行详细部署以提供推理服务
5. 访问GitHub仓库获取更多信息

Yuan2.0 M32 Hf Int8