Yafsdp

使用场景使用YaFSDP进行7B至70B参数规模的语言模型预训练。在64至256个设备上应用YaFSDP进行模型训练,以提高效率。利用YaFSDP进行2048至...