Slicegpt

使用场景切片GPT可用于减少大型语言模型的内存消耗。切片GPT可用于加速大型语言模型的推理过程。切片GPT可用于提高预训练模型的计算效率。产品特色后训练稀疏化模...