Promptfoo

使用场景评估LLM生成的文本是否准确测试不同的prompt对模型输出的影响比较不同模型在相同prompt下的表现产品特色创建测试用例列表使用内置的评估指标或自定...

Promptfoo

类别：开发与工具,模型训练与部署,LLM,prompt测试,质量评估,测试库,普通产品

官网:https://www.promptfoo.dev 更新时间：2025-08-01 15:01:13
使用场景
评估LLM生成的文本是否准确
测试不同的prompt对模型输出的影响
比较不同模型在相同prompt下的表现
产品特色
创建测试用例列表
使用内置的评估指标或自定义指标
比较不同的prompt和模型输出

看360 - 吹响未来的号角！