Deepmark AI

使用场景在自定义数据集上评估不同的生成式 AI 模型对生成式 AI 模型的准确性进行测试评估生成式 AI 模型的成本效益产品特色可靠性评估准确性评估成本分析相关...

  • Deepmark AI

    类别:AI模型评测,AI开发平台,人工智能,大型语言模型,可靠性评估,准确性评估,成本分析,普通产品,开源,
    官网:https://github.com/IngestAI/deepmark 更新时间:2025-08-01 16:03:59
  • 使用场景

    在自定义数据集上评估不同的生成式 AI 模型

    对生成式 AI 模型的准确性进行测试

    评估生成式 AI 模型的成本效益

    产品特色

    可靠性评估

    准确性评估

    成本分析

    相关性评估

    延迟评估

    失败率评估