Nemotron Mini 4B Instruct

使用场景在视频游戏中集成模型,以提供角色扮演对话用于商业用途,如客户服务聊天机器人在需要快速响应和设备部署的场景中使用产品特色角色扮演响应生成检索增强生成功能调...

  • Nemotron Mini 4B Instruct

    类别:AI模型,AI模型推理训练,小型语言模型,蒸馏,剪枝,量化,角色扮演,检索增强生成,功能调用,普通产品,开源,
    官网:https://huggingface.co/nvidia/Nemotron-Mini-4B-Instruct 更新时间:2025-08-01 19:07:59
  • 使用场景

    在视频游戏中集成模型,以提供角色扮演对话

    用于商业用途,如客户服务聊天机器人

    在需要快速响应和设备部署的场景中使用

    产品特色

    角色扮演响应生成

    检索增强生成

    功能调用

    优化以提高速度和设备部署

    支持 4096 个令牌的上下文长度

    通过蒸馏、剪枝和量化技术优化

    使用教程

    1. 从 Hugging Face 导入 AutoTokenizer 和 AutoModelForCausalLM。

    2. 使用 'nvidia/Nemotron-Mini-4B-Instruct' 预训练模型加载 tokenizer 和 model。

    3. 使用推荐的 prompt 模板进行消息格式化。

    4. 调用 model.generate 函数生成响应。

    5. 使用 tokenizer.decode 函数将生成的令牌转换为文本。

    6. (可选)使用 pipeline 进行文本生成,但需要手动分配 tokenizer 对象。