AI模型 研究工具 多模态 大语言模型 推理 混合偏好优化 图像-文本-文本 普通产品 开源
使用场景在MathVista数据集上进行准确率测试,达到67.0%的准确率。使用InternVL2-8B-MPO进行图像描述生成,提供详细的图像内容描述。在多图...