AI模型 AI开发助手 LLM C CUDA 机器学习 自然语言处理 普通产品 开源
使用场景使用 karpathy/llm.c 实现了一个基于 GPT-2 的小规模语言模型,并通过优化版本大幅提升了训练速度在 karpathy/llm.c 的基...
使用场景
使用 karpathy/llm.c 实现了一个基于 GPT-2 的小规模语言模型,并通过优化版本大幅提升了训练速度
在 karpathy/llm.c 的基础上,开发了一个支持 Llama2 架构的 LLM 训练工具
参考 karpathy/llm.c 的代码结构和实现方式,自行开发了一个针对特定应用场景的 LLM 模型
产品特色
使用简单的 C/CUDA 实现 LLM 训练
提供干净、简单的参考实现
包含更优化的版本,性能接近 PyTorch
支持多种现代 LLM 架构