Promptfoo

使用场景评估LLM生成的文本是否准确测试不同的prompt对模型输出的影响比较不同模型在相同prompt下的表现产品特色创建测试用例列表使用内置的评估指标或自定...

  • Promptfoo

    类别:开发与工具,模型训练与部署,LLM,prompt测试,质量评估,测试库,普通产品
    官网:https://www.promptfoo.dev 更新时间:2025-08-01 15:01:13
  • 使用场景

    评估LLM生成的文本是否准确

    测试不同的prompt对模型输出的影响

    比较不同模型在相同prompt下的表现

    产品特色

    创建测试用例列表

    使用内置的评估指标或自定义指标

    比较不同的prompt和模型输出