AI模型评测 AI学术研究 视觉语言模型 基准测试 多模态 人工审查 数据泄露 评估指标 普通产品 开源
使用场景研究人员可以使用MMStar评估自己训练的视觉语言模型在不同视觉语言任务上的表现。模型开发者可以通过MMStar发现自己模型存在的数据泄露问题,并采取相...