AI模型 Elo评级 RAG LLM 评估工具 Python 优质新品 开源
使用场景使用RAGElo评估不同RAG管道对问答任务的影响利用RAGElo进行LLM代理的批量评估,以优化问答系统将RAGElo集成到生产流程中,自动评估和选择...