AI模型 AI 模型推理训练 小型模型 视觉词汇 LVLMs 普通GPU 普通产品 开源
使用场景研究人员使用Vary-toy在普通GPU上进行文档视觉问答实验研究人员使用Vary-toy在普通GPU上进行图表问答实验研究人员使用Vary-toy在普...
使用场景
研究人员使用Vary-toy在普通GPU上进行文档视觉问答实验
研究人员使用Vary-toy在普通GPU上进行图表问答实验
研究人员使用Vary-toy在普通GPU上进行引用关注指代实验
产品特色
基于Qwen-1.8B的小型Vary模型
引入改进的视觉词汇
替换自然图像的负样本为目标检测驱动的正样本数据
高效编码与自然物体对应的视觉信息
在DocVQA、ChartQA、RefCOCO、MMVet上取得良好性能