AI模型评测 AI开发平台 开发编程 度量 大型语言模型 评估框架 评价模型 聊天机器人 LLM ChatGPT 普通产品 开源
使用场景使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试基于语言链的应用,通过DeepEval进行自动化测试使用合成查询功能快速发现模型的问题...
使用场景
使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试
基于语言链的应用,通过DeepEval进行自动化测试
使用合成查询功能快速发现模型的问题
产品特色
针对答案相关性、事实一致性、有毒性、偏见的测试
查看测试、实现和比较的Web UI
通过合成查询-答案自动评估
与LangChain等常见框架集成
合成查询生成
仪表板