Deepeval_开发

Deepeval

类别：AI模型评测,AI开发平台,开发编程,度量,大型语言模型,评估框架,评价模型,聊天机器人,LLM,ChatGPT,普通产品,开源,

官网:https://github.com/confident-ai/deepeval 更新时间：2025-08-01 15:07:21
使用场景
使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试
基于语言链的应用,通过DeepEval进行自动化测试
使用合成查询功能快速发现模型的问题
产品特色
针对答案相关性、事实一致性、有毒性、偏见的测试
查看测试、实现和比较的Web UI
通过合成查询-答案自动评估
与LangChain等常见框架集成
合成查询生成
仪表板

Deepeval