深度学习

  • Flexheadfa

    使用场景在 A100 GPU 上,使用 (qk dim, v_dim) = (32,64) 配置,FlexHeadFA 显著提升了模型的推理速度。开发者可以通过...
    模型训练与部署,开发与工具,深度学习,注意力机制,内存优化,高性能计算,自然语言处理,普通产品,开源, 08月02日 0 0
  • Deepep

    使用场景在大规模分布式训练中,使用 DeepEP 的高吞吐量内核加速 MoE 模型的 dispatch 和 combine 操作,显著提高训练效率。在推理阶段,...
    开发与工具,模型训练与部署,深度学习,混合专家模型,专家并行,通信库,低延迟,高吞吐量,GPU 加速,优质新品,开源, 08月02日 0 0
  • Deepgemm

    使用场景在深度学习模型的训练过程中,使用DeepGEMM加速FP8格式的矩阵乘法运算,显著提升训练速度。在推理阶段,通过DeepGEMM的分组GEMM功能,优化...
    开发与工具,模型训练与部署,深度学习,矩阵乘法,CUDA,优化,高性能计算,开源,优质新品,开源, 08月02日 0 0
  • Dualpipe

    使用场景在大规模语言模型训练中,使用DualPipe算法显著减少了训练时间。在计算机视觉任务中,通过优化并行策略,提高了模型的收敛速度。在多节点分布式训练环境中...
    模型训练与部署,开发与工具,深度学习,分布式训练,并行计算,优化,高性能,优质新品,开源, 08月02日 0 0
  • EPLB

    使用场景在自然语言处理(NLP)任务中,使用EPLB优化Transformer模型的专家并行训练,显著提高训练速度。在计算机视觉任务中,通过EPLB实现多GPU...
    模型训练与部署,开发与工具,深度学习,负载均衡,专家并行,分布式训练,优化,优质新品,开源, 08月02日 0 0
  • Profiling Data In DeepSeek Infra

    使用场景研究人员可以利用该数据优化大规模预训练模型的分布式训练策略。开发者可以参考该数据改进推理框架中的通信和计算效率。学术团队可以基于该数据研究新的混合专家模...
    模型训练与部署,研究工具,深度学习,性能分析,分布式计算,通信重叠,PyTorch,普通产品,开源, 08月02日 0 0
  • Photodoodle

    使用场景使用 PhotoDoodle 将普通照片转换为带有魔法特效的艺术图像通过该模型为卡通角色添加怪物风格的艺术效果利用 PhotoDoodle 为手绘线条图...
    AI设计工具,图片编辑,图像编辑,深度学习,少样本学习,艺术风格,特效,开源,普通产品,开源, 08月02日 0 0
  • Unitok

    使用场景研究人员使用UniTok进行图像生成任务,以生成高质量的视觉内容。开发者利用UniTok构建多模态语言模型,用于视觉问答和图像分类。企业将UniTok集...
    AI模型,图片生成,人工智能,视觉生成,视觉理解,多模态,图像处理,深度学习,普通产品,开源, 08月02日 0 0
  • Cogview4 6B

    使用场景根据描述生成一个红色跑车在海边的图像根据中文文本生成传统节日场景的图像根据英文描述生成科幻场景的图像产品特色支持高分辨率图像生成(512px 至 204...
    图片生成,AI设计工具,文本到图像,深度学习,图像生成,创意设计,多语言支持,普通产品,开源, 08月02日 0 0
  • Qwq 32B

    使用场景在学术研究中,用于解决复杂的数学和逻辑问题。在编程辅助中,帮助开发者快速生成代码逻辑和注释。在创意写作中,为作家提供灵感和故事线索的生成。产品特色强大的...
    AI模型,研究工具,推理,文本生成,长文本处理,深度学习,Transformer,普通产品,开源, 08月02日 0 0