通信效率

  • DeepSeek-V3:AI架构中的硬件与模型协同设计新突破

    近日,DeepSeek团队在arXiv上发布了题为《Insights into DeepSeek-V3: Scaling Challenges and Refl...
    AI架构,DeepSeek-V3,内存效率,大型语言模型,硬件与模型协同设计,计算效率,通信效率 07月29日 0 0
  • T3

    使用场景用于加速大型语言模型T-NLG的训练过程在PALM和MT-NLG等模型的推断中提高通信效率适用于需要最大化计算和通信重叠的场景产品特色透明地重叠串行通信...
    AI模型推理训练,AI模型,分布式技术,硬件-软件共同设计,计算重叠,通信效率,普通产品,开源, 08月01日 0 0