Shieldgemma_创作

Shieldgemma

类别：AI内容检测,AI网络安全,内容审核,文本生成,安全模型,大型语言模型,普通产品,开源,

官网:https://huggingface.co/google/shieldgemma-2b 更新时间：2025-08-01 18:44:04
使用场景
社交媒体平台使用ShieldGemma模型自动检测和过滤仇恨言论。
在线教育平台利用该模型确保讨论区的交流健康、积极。
企业内部论坛采用ShieldGemma模型监控和防止职场骚扰。
产品特色
文本到文本的解码器仅大型语言模型，专注于内容审核。
提供三种不同规模的模型：2B、9B和27B参数。
使用特定模式格式化输入，以实现最佳性能。
输出文本字符串，表示用户输入或模型输出是否违反提供的政策。
在公平性特征上进行了安全评估，符合内部指导方针。
作为负责任的生成AI工具包的一部分，用于改善AI应用的安全性。
使用教程
安装必要的库：`pip install -U transformers[accelerate]`。
从Hugging Face导入AutoTokenizer和AutoModelForCausalLM。
使用AutoTokenizer和AutoModelForCausalLM加载ShieldGemma模型。
根据需要格式化提示（prompt），包括前文、用户提示、安全政策描述等。
将格式化后的提示输入模型，并使用模型进行内容审核。
根据模型输出的'Yes'或'No'判断内容是否违反安全政策。
根据需要调整模型参数或提示格式，以优化审核效果。

Shieldgemma