AI模型评测 AI开发平台 开发编程 度量 大型语言模型 评估框架 评价模型 聊天机器人 LLM ChatGPT 普通产品 开源
使用场景使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试基于语言链的应用,通过DeepEval进行自动化测试使用合成查询功能快速发现模型的问题...