Redrafter

使用场景使用ReDrafter加速数十亿参数规模的生产模型的推理过程。在NVIDIA GPU上部署ReDrafter,实现每秒生成token数的2.7倍提升。将...