使用场景
研究人员使用排行榜来比较不同模型在特定任务上的表现
开发者利用排行榜数据来选择适合其应用场景的模型
企业决策者参考排行榜来制定技术采购或研发策略
产品特色
提供多模态模型的实时排名和性能数据
支持通过创建PR在VLMEvalKit中添加新模型
包含8个多模态基准测试的性能评估
提供详细的模型性能报告,包括各项基准测试的得分
允许用户通过联系邮箱opencompass@pjlab.org.cn获取帮助和支持
使用教程
访问OpenCompass多模态排行榜网站
查看当前的多模态模型排名和性能数据
通过点击感兴趣的模型,获取更详细的性能报告
如果需要添加新模型,可以访问VLMEvalKit并创建PR
通过排行榜提供的联系方式获取进一步的帮助和支持