Shieldgemma

使用场景社交媒体平台使用ShieldGemma模型自动检测和过滤仇恨言论。在线教育平台利用该模型确保讨论区的交流健康、积极。企业内部论坛采用ShieldGemm...

  • Shieldgemma

    类别:AI内容检测,AI网络安全,内容审核,文本生成,安全模型,大型语言模型,普通产品,开源,
    官网:https://huggingface.co/google/shieldgemma-2b 更新时间:2025-08-01 18:44:04
  • 使用场景

    社交媒体平台使用ShieldGemma模型自动检测和过滤仇恨言论。

    在线教育平台利用该模型确保讨论区的交流健康、积极。

    企业内部论坛采用ShieldGemma模型监控和防止职场骚扰。

    产品特色

    文本到文本的解码器仅大型语言模型,专注于内容审核。

    提供三种不同规模的模型:2B、9B和27B参数。

    使用特定模式格式化输入,以实现最佳性能。

    输出文本字符串,表示用户输入或模型输出是否违反提供的政策。

    在公平性特征上进行了安全评估,符合内部指导方针。

    作为负责任的生成AI工具包的一部分,用于改善AI应用的安全性。

    使用教程

    安装必要的库:`pip install -U transformers[accelerate]`。

    从Hugging Face导入AutoTokenizer和AutoModelForCausalLM。

    使用AutoTokenizer和AutoModelForCausalLM加载ShieldGemma模型。

    根据需要格式化提示(prompt),包括前文、用户提示、安全政策描述等。

    将格式化后的提示输入模型,并使用模型进行内容审核。

    根据模型输出的'Yes'或'No'判断内容是否违反安全政策。

    根据需要调整模型参数或提示格式,以优化审核效果。