深度学习

  • Claude 3.7 Sonnet

    使用场景在 Cursor 测试中,Claude 3.7 Sonnet 被评为最适合实际编程任务的模型。Vercel 利用 Claude 3.7 Sonnet 构...
    代码助手,AI模型,人工智能,深度学习,编程,推理,API,全球热门 08月02日 0 0
  • Qwq Max Preview

    使用场景开发者使用 QwQ-Max-Preview 生成高效的代码片段,提升开发效率。研究人员利用其深度推理能力,探索复杂问题的解决方案。技术爱好者通过开源模型...
    AI模型,开发与工具,人工智能,深度学习,推理,编程,开源,Agent,创新,中文精选,开源, 08月02日 0 0
  • Flashmla

    使用场景在自然语言处理任务中,FlashMLA 可以显著提升 Transformer 模型的推理速度。在计算机视觉任务中,FlashMLA 可以优化卷积神经网络...
    模型训练与部署,开发与工具,深度学习,GPU 加速,高效计算,内存优化,自然语言处理,优质新品,开源, 08月02日 0 0
  • Flexheadfa

    使用场景在 A100 GPU 上,使用 (qk dim, v_dim) = (32,64) 配置,FlexHeadFA 显著提升了模型的推理速度。开发者可以通过...
    模型训练与部署,开发与工具,深度学习,注意力机制,内存优化,高性能计算,自然语言处理,普通产品,开源, 08月02日 0 0
  • Deepep

    使用场景在大规模分布式训练中,使用 DeepEP 的高吞吐量内核加速 MoE 模型的 dispatch 和 combine 操作,显著提高训练效率。在推理阶段,...
    开发与工具,模型训练与部署,深度学习,混合专家模型,专家并行,通信库,低延迟,高吞吐量,GPU 加速,优质新品,开源, 08月02日 0 0
  • Deepgemm

    使用场景在深度学习模型的训练过程中,使用DeepGEMM加速FP8格式的矩阵乘法运算,显著提升训练速度。在推理阶段,通过DeepGEMM的分组GEMM功能,优化...
    开发与工具,模型训练与部署,深度学习,矩阵乘法,CUDA,优化,高性能计算,开源,优质新品,开源, 08月02日 0 0
  • Dualpipe

    使用场景在大规模语言模型训练中,使用DualPipe算法显著减少了训练时间。在计算机视觉任务中,通过优化并行策略,提高了模型的收敛速度。在多节点分布式训练环境中...
    模型训练与部署,开发与工具,深度学习,分布式训练,并行计算,优化,高性能,优质新品,开源, 08月02日 0 0
  • EPLB

    使用场景在自然语言处理(NLP)任务中,使用EPLB优化Transformer模型的专家并行训练,显著提高训练速度。在计算机视觉任务中,通过EPLB实现多GPU...
    模型训练与部署,开发与工具,深度学习,负载均衡,专家并行,分布式训练,优化,优质新品,开源, 08月02日 0 0
  • Profiling Data In DeepSeek Infra

    使用场景研究人员可以利用该数据优化大规模预训练模型的分布式训练策略。开发者可以参考该数据改进推理框架中的通信和计算效率。学术团队可以基于该数据研究新的混合专家模...
    模型训练与部署,研究工具,深度学习,性能分析,分布式计算,通信重叠,PyTorch,普通产品,开源, 08月02日 0 0
  • Photodoodle

    使用场景使用 PhotoDoodle 将普通照片转换为带有魔法特效的艺术图像通过该模型为卡通角色添加怪物风格的艺术效果利用 PhotoDoodle 为手绘线条图...
    AI设计工具,图片编辑,图像编辑,深度学习,少样本学习,艺术风格,特效,开源,普通产品,开源, 08月02日 0 0