使用场景
1. 使用Lookahead Decoding改进自己的代码,提高推理效率。
2. 运行minimal.py查看Lookahead Decoding带来的速度提升。
3. 使用Lookahead Decoding聊天机器人进行聊天。
产品特色
打破LLM推理的顺序依赖性
提高推理效率
支持LLaMA和Greedy Search两种模型
使用场景
1. 使用Lookahead Decoding改进自己的代码,提高推理效率。
2. 运行minimal.py查看Lookahead Decoding带来的速度提升。
3. 使用Lookahead Decoding聊天机器人进行聊天。
产品特色
打破LLM推理的顺序依赖性
提高推理效率
支持LLaMA和Greedy Search两种模型