Hallucination Leaderboard

使用场景研究人员可以使用该排行榜来比较不同LLM模型在生成总结时的幻觉率，从而选择更可靠的模型。开发者可以利用该工具评估自己开发的LLM模型性能，优化模型以减少...