Profiling Data In DeepSeek Infra

使用场景研究人员可以利用该数据优化大规模预训练模型的分布式训练策略。开发者可以参考该数据改进推理框架中的通信和计算效率。学术团队可以基于该数据研究新的混合专家模...

  • Profiling Data In DeepSeek Infra

    类别:模型训练与部署,研究工具,深度学习,性能分析,分布式计算,通信重叠,PyTorch,普通产品,开源,
    官网:https://github.com/deepseek-ai/profile-data 更新时间:2025-08-02 10:32:30
  • 使用场景

    研究人员可以利用该数据优化大规模预训练模型的分布式训练策略。

    开发者可以参考该数据改进推理框架中的通信和计算效率。

    学术团队可以基于该数据研究新的混合专家模型路由策略。

    产品特色

    提供训练和推理阶段的性能分析数据,帮助优化模型训练和推理效率。

    支持通过 Chrome 或 Edge 浏览器的 tracing 工具直观展示性能分析结果。

    模拟平衡的 MoE 路由策略,为混合专家模型提供性能分析基准。

    展示 DualPipe 框架中前向和后向传播的重叠策略,提升并行计算效率。

    提供预填充和解码阶段的性能分析,优化大规模推理任务的通信和计算策略。

    使用教程

    1. 访问项目主页,下载训练和推理阶段的性能分析数据文件。

    2. 打开 Chrome 或 Edge 浏览器,输入 chrome://tracing 或 edge://tracing 进入性能分析工具。

    3. 加载下载的性能分析数据文件,查看详细的性能分析结果。

    4. 根据分析结果,优化模型的训练和推理策略,调整通信和计算的重叠方式。

    5. 参考项目文档,了解不同阶段的性能优化建议和最佳实践。