AI模型推理训练 AI模型 分布式技术 硬件-软件共同设计 计算重叠 通信效率 普通产品 开源
使用场景用于加速大型语言模型T-NLG的训练过程在PALM和MT-NLG等模型的推断中提高通信效率适用于需要最大化计算和通信重叠的场景产品特色透明地重叠串行通信...
使用场景
用于加速大型语言模型T-NLG的训练过程
在PALM和MT-NLG等模型的推断中提高通信效率
适用于需要最大化计算和通信重叠的场景
产品特色
透明地重叠串行通信和计算
最小化与计算的资源争用
简单配置生产者的输出地址空间
轻量级的跟踪和触发机制
利用增强计算的存储器进行通信的相关计算