Deepeval

使用场景使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试基于语言链的应用,通过DeepEval进行自动化测试使用合成查询功能快速发现模型的问题...

  • Deepeval

    类别:AI模型评测,AI开发平台,开发编程,度量,大型语言模型,评估框架,评价模型,聊天机器人,LLM,ChatGPT,普通产品,开源,
    官网:https://github.com/confident-ai/deepeval 更新时间:2025-08-01 15:07:21
  • 使用场景

    使用简单的单元测试方式针对ChatGPT回答进行相关性、一致性测试

    基于语言链的应用,通过DeepEval进行自动化测试

    使用合成查询功能快速发现模型的问题

    产品特色

    针对答案相关性、事实一致性、有毒性、偏见的测试

    查看测试、实现和比较的Web UI

    通过合成查询-答案自动评估

    与LangChain等常见框架集成

    合成查询生成

    仪表板