Flashattention

使用场景在自然语言处理任务中,使用FlashAttention加速BERT模型的训练。在大规模文本生成任务中,利用FlashAttention减少GPT模型的内...