使用场景
内容生成服务通过RouteLLM智能选择模型,降低成本。
聊天机器人使用RouteLLM根据查询复杂度选择最合适的模型。
企业利用RouteLLM进行基准测试,评估不同模型的性能和成本效益。
产品特色
作为OpenAI客户端的替代品,智能路由简单查询到成本更低的模型。
提供经过训练的路由器,减少成本同时保持性能。
支持通过配置文件或参数来扩展新路由器和比较不同路由器的性能。
支持本地模型路由和OpenAI兼容服务器的启动。
提供了阈值校准功能,以优化成本与质量的平衡。
包含评估框架,用于衡量不同路由策略在基准测试中的性能。
使用教程
安装RouteLLM框架,可以从PyPI或源代码安装。
初始化RouteLLM控制器,并配置强模型和弱模型。
根据需要设置成本阈值,以控制成本与质量的权衡。
使用RouteLLM生成完成请求,指定使用路由器和阈值。
根据反馈调整配置,优化路由策略以达到最佳性能。
利用评估框架对不同路由器进行基准测试,评估其性能。
