Vary Toy

使用场景研究人员使用Vary-toy在普通GPU上进行文档视觉问答实验研究人员使用Vary-toy在普通GPU上进行图表问答实验研究人员使用Vary-toy在普...

  • Vary Toy

    类别:AI模型,AI 模型推理训练,小型模型,视觉词汇,LVLMs,普通GPU,普通产品,开源,
    官网:https://huggingface.co/papers/2401.12503 更新时间:2025-08-01 17:01:11
  • 使用场景

    研究人员使用Vary-toy在普通GPU上进行文档视觉问答实验

    研究人员使用Vary-toy在普通GPU上进行图表问答实验

    研究人员使用Vary-toy在普通GPU上进行引用关注指代实验

    产品特色

    基于Qwen-1.8B的小型Vary模型

    引入改进的视觉词汇

    替换自然图像的负样本为目标检测驱动的正样本数据

    高效编码与自然物体对应的视觉信息

    在DocVQA、ChartQA、RefCOCO、MMVet上取得良好性能