开发与工具 模型训练与部署 LLM prompt测试 质量评估 测试库 普通产品
使用场景评估LLM生成的文本是否准确测试不同的prompt对模型输出的影响比较不同模型在相同prompt下的表现产品特色创建测试用例列表使用内置的评估指标或自定...
使用场景
评估LLM生成的文本是否准确
测试不同的prompt对模型输出的影响
比较不同模型在相同prompt下的表现
产品特色
创建测试用例列表
使用内置的评估指标或自定义指标
比较不同的prompt和模型输出