Sky T1 32B Preview

使用场景研究人员可以利用该模型的开源代码和权重,进行推理模型的进一步研究和优化。开发者可以基于该模型开发新的应用程序,特别是在编程辅助和数学问题解决领域。学术机...

  • Sky T1 32B Preview

    类别:AI模型,开发与工具,"推理模型、开源、低成本、高性能、编程",普通产品,开源,
    官网:https://novasky-ai.github.io/posts/sky-t1/ 更新时间:2025-08-02 10:15:06
  • 使用场景

    研究人员可以利用该模型的开源代码和权重,进行推理模型的进一步研究和优化。

    开发者可以基于该模型开发新的应用程序,特别是在编程辅助和数学问题解决领域。

    学术机构可以将其作为教学资源,让学生了解和实践高级推理模型的训练和应用。

    产品特色

    在数学和编程领域均展现出强大的推理能力。

    使用QwQ-32B-Preview生成训练数据,并通过拒绝采样和数据重写提高数据质量。

    利用8个H100 GPU和DeepSpeed Zero-3 offload在19小时内完成训练,成本约450美元。

    提供详细的开源代码和模型权重,便于社区复现和改进。

    通过在不同数据集上的评估,展示了模型在数学和编程任务上的竞争力。

    使用教程

    1. 访问项目GitHub页面,获取开源代码和模型权重。

    2. 根据提供的技术报告和wandb日志,了解模型的训练细节和数据处理方法。

    3. 使用提供的基础设施代码,构建数据、训练和评估模型。

    4. 利用模型权重进行推理任务,或在模型基础上进行进一步的微调和开发。

    5. 参考评估结果,了解模型在不同任务上的表现,优化模型应用。